Als «machine-learning» getaggte Fragen

7
Zielfunktion für die Klassifizierung mehrerer Etiketten

Die übliche Zielfunktion für die Klassifizierung mehrerer Etiketten (z. B. M-Etiketten) ist die binäre Kreuzentropie. Das Problem ist, wenn wir binäre Kreuzentropie verwenden, nehmen wir an, dass die Ausgabebezeichnungen unabhängig voneinander sind, was das Problem zu M unabhängigen binären...

7
Was sind einige Situationen, in denen die Normalisierung der Eingabedaten auf Null bedeutet, dass die Einheitsvarianz nicht angemessen oder nicht vorteilhaft ist?

Ich habe beim maschinellen Lernen viele Male eine Normalisierung der Eingabedaten auf den Mittelwert Null und die Einheitsvarianz gesehen. Ist dies eine gute Praxis, die ständig durchgeführt werden muss, oder gibt es Zeiten, in denen dies nicht angemessen oder nicht vorteilhaft ist?...

7
Kann das Problem des verschwindenden Gradienten gelöst werden, indem die Eingabe von tanh mit einem Koeffizienten multipliziert wird?

Nach meinem Verständnis tritt das Problem des verschwindenden Gradienten beim Training neuronaler Netze auf, wenn der Gradient jeder Aktivierungsfunktion kleiner als 1 ist, so dass das Produkt dieser Gradienten sehr klein wird, wenn Korrekturen durch viele Schichten zurückpropagiert werden. Ich...