Kann ein neuronales Netzwerk berechnen ?

11

Im Geiste des berühmten Tensorflow Fizz Buzz- Witzes und des XOr-Problems begann ich zu überlegen , ob es möglich ist, ein neuronales Netzwerk zu entwerfen, das die Funktion implementiert .y=x2

Bei einer bestimmten Darstellung einer Zahl (z. B. als Vektor in binärer Form, so dass diese Zahl 5als dargestellt wird [1,0,1,0,0,0,0,...]) sollte das neuronale Netzwerk lernen, in diesem Fall sein Quadrat 25 zurückzugeben.

Wenn ich implementieren könnte, könnte ich wahrscheinlich y = x ^ 3 und allgemein jedes Polynom von x implementieren , und dann könnte ich mit Taylor-Reihen y = \ sin (x) approximieren , was das Fizz Buzz-Problem lösen würde - ein neuronales Netzwerk, das den Rest der Teilung finden kann.y=x2y=x3y=sin(x)

Es ist klar, dass nur der lineare Teil von NNs diese Aufgabe nicht ausführen kann. Wenn wir also die Multiplikation durchführen könnten, würde dies dank der Aktivierungsfunktion geschehen.

Können Sie Ideen vorschlagen oder zu diesem Thema lesen?

Boris Burkov
quelle

Antworten:

9

Neuronale Netze werden auch als universelle Funktionsnäherung bezeichnet, die auf dem universellen Funktionsnäherungssatz basiert . Es sagt, dass:

In der mathematischen Theorie künstlicher neuronaler Netze besagt der universelle Approximationssatz, dass ein Feed-Forward-Netzwerk mit einer einzelnen verborgenen Schicht, die eine endliche Anzahl von Neuronen enthält, unter milden Annahmen über die Aktivierungsfunktion kontinuierliche Funktionen auf kompakten Teilmengen von Rn approximieren kann

Das heißt, ein ANN mit einer nichtlinearen Aktivierungsfunktion könnte die Funktion abbilden, die den Eingang mit dem Ausgang in Beziehung setzt. Die Funktion könnte unter Verwendung der Regression ANN leicht angenähert werden.y=x2

Sie können eine hervorragende Lektion finden hier mit einem Notebook Beispiel.

Aufgrund dieser Fähigkeit könnte ANN auch komplexe Beziehungen abbilden, beispielsweise zwischen einem Bild und seinen Beschriftungen.

Shubham Panchal
quelle
2
Vielen Dank, genau darum habe ich gebeten!
Boris Burkov
4
Obwohl es stimmt, ist es eine sehr schlechte Idee, das zu lernen. Ich sehe nicht ein, woher eine Verallgemeinerungskraft kommen würde. NN leuchten, wenn es etwas zu verallgemeinern gibt. Wie CNN für Vision, die Muster erfasst, oder RNN, das Trends erfassen kann.
Jeffrey unterstützt Monica
14

f(x)=x2R.n

R.nR.nxf(x)=x2R.f(x)=x2xR.

Sünde(x)x=0x10000

Maschinenlerner
quelle
3
Schöner Fang! "kompaktes Set".
Esmailian
2
Vielen Dank, Kumpel! Augenöffner!
Boris Burkov