Nehmen wir an, wir möchten eine Regression für einfache f = x * y
Verwendung eines standardmäßigen tiefen neuronalen Netzwerks durchführen.
Ich erinnere mich, dass es Forschungsergebnisse gibt, die besagen, dass NN mit einer Hiden-Schicht jede Funktion approximieren kann, aber ich habe es versucht und ohne Normalisierung konnte NN nicht einmal diese einfache Multiplikation approximieren. Nur Log-Normalisierung der Daten hat geholfen. m = x*y => ln(m) = ln(x) + ln(y).
Aber das sieht aus wie ein Betrüger. Kann NN dies ohne Protokollnormalisierung tun? Der Unbekannte ist natürlich (was mich betrifft) - ja, also ist die Frage eher was soll Typ / Konfiguration / Layout eines solchen NN sein?