In einigen Fällen scheint es möglich zu sein, ähnliche Ergebnisse wie bei einem neuronalen Netzwerk mit einer multivariaten linearen Regression zu erzielen, und die multivariate lineare Regression ist superschnell und einfach.
Unter welchen Umständen können neuronale Netze bessere Ergebnisse liefern als multivariate lineare Regression?
quelle
Sie erwähnen die lineare Regression. Dies hängt mit der logistischen Regression zusammen , die über einen ähnlich schnellen Optimierungsalgorithmus verfügt. Wenn Sie Grenzen für die Zielwerte haben, z. B. bei einem Klassifizierungsproblem, können Sie die logistische Regression als Verallgemeinerung der linearen Regression anzeigen.
Neuronale Netze sind streng allgemeiner als die logistische Regression der ursprünglichen Eingänge, da dies einem Überspring-Layer-Netz (mit Verbindungen, die die Eingänge mit den Ausgängen direkt verbinden) mit versteckten Knoten entspricht.0
Wenn Sie Features wie hinzufügen , ähnelt dies der Auswahl von Gewichten für einige ausgeblendete Knoten in einer einzelnen ausgeblendeten Ebene. Es gibt nicht genau eine Entsprechung, da das Modellieren einer Funktion wie mit Sigmoiden mehr als ein verstecktes Neuron erfordern kann. Wenn Sie ein neuronales Netzwerk trainieren, lassen Sie es seine eigenen verborgenen Gewichte finden, die möglicherweise besser sind. Es kann auch länger dauern und inkonsistent sein. Sie können mit einer Annäherung an die logistische Regression mit zusätzlichen Funktionen beginnen und die Eingabe in verborgene Gewichte langsam trainieren. Dies sollte letztendlich besser funktionieren als die logistische Regression mit zusätzlichen Funktionen. Je nach Problem kann die Trainingszeit vernachlässigbar oder unerschwinglich sein.x3 1−1 x3
Eine Zwischenstrategie besteht darin, eine große Anzahl zufälliger Knoten auszuwählen, ähnlich wie dies beim Initialisieren eines neuronalen Netzwerks geschieht, und die Eingabe-zu-versteckten Gewichte zu korrigieren. Die Optimierung über die * -zu-Output-Gewichte bleibt linear. Dies wird als extreme Lernmaschine bezeichnet . Es funktioniert mindestens so gut wie die ursprüngliche logistische Regression.
quelle
Die lineare Regression zielt darauf ab, die Daten zu trennen, die linear trennbar sind. Ja, Sie können zusätzliche Polynome> dritten Grades verwenden, aber auf diese Weise haben Sie erneut einige Annahmen zu den Daten gemacht, die Sie haben, da Sie die Struktur der Zielfunktion definiert haben. Im neuronalen Netz. Im Allgemeinen verfügen Sie über eine Eingabeebene, die die linearen Trennzeichen für die von Ihnen gespeicherten Daten erstellt, und eine ausgeblendete Ebene, UND die Regionen, die einige Klassen begrenzen, und eine letzte Ebene, ODER alle diese Regionen. Auf diese Weise können alle Daten, die Sie haben, nicht linear klassifiziert werden, und alle diese Prozesse werden mit intern erlernten Gewichten und definierten Funktionen ausgeführt. Das Erhöhen der Merkmalsnummer für die lineare Regression steht außerdem dem "Fluch der Dimensionalität" entgegen. Darüber hinaus benötigen einige Anwendungen als Ausgabe mehr Wahrscheinlichkeitsergebnisse als konstante Zahlen.
quelle