Ich habe einem Vortrag zugehört und diese Folie gesehen:
Wie wahr ist das?
deep-learning
deep-belief-networks
Franck Dernoncourt
quelle
quelle
Antworten:
Ich habe den AI StackExchange durchsucht und bin auf eine sehr ähnliche Frage gestoßen : Was unterscheidet Deep Learning von anderen neuronalen Netzwerken?
Da AI StackExchange morgen (wieder) geschlossen wird, kopiere ich die beiden wichtigsten Antworten hier (Benutzerbeiträge unter Lizenz von cc by-sa 3.0 mit Namensnennung erforderlich):
Urheber: mommi84less
Urheber: lejlot
Eine weitere interessante Folie:
Quelle
quelle
Der Schulabbrecher von Hinton im Jahr 2006 gilt als die größte Verbesserung im Bereich des Tiefenlernens in den letzten 10 Jahren, da er viel Überanpassung reduziert.
quelle
Dies ist sicherlich eine Frage, die Kontroversen hervorrufen wird.
Wenn neuronale Netze beim Tiefenlernen verwendet werden, werden sie in der Regel auf eine Weise trainiert, die in den 1980er Jahren nicht verwendet wurde. Insbesondere Strategien, die einzelne Schichten des neuronalen Netzwerks vortrainieren, um Merkmale auf verschiedenen Ebenen zu erkennen, sollen das Trainieren von Netzwerken mit mehreren Schichten erleichtern. Das ist sicherlich eine Neuentwicklung seit den 1980er Jahren.
quelle
Der Schlüssel ist das Wort "tief" im tiefen Lernen. Jemand (vergessen ref) in den 80er Jahren bewiesen , dass alle nicht-linearen Funktionen durch eine angenähert werden könnten einzelne Schicht neuronales Netz mit, natürlich, eine ausreichend große Anzahl von versteckten Einheiten. Ich denke, dieses Ergebnis hat wahrscheinlich die Menschen davon abgehalten, in früheren Zeiten ein tieferes Netzwerk zu suchen.
Die Tiefe des Netzwerks hat sich jedoch als das entscheidende Element in der hierarchischen Darstellung erwiesen, das den Erfolg vieler heutiger Anwendungen bestimmt.
quelle
Nicht genau, der ANN startet in den 50er Jahren. Schauen Sie sich eine der Präsentationen von Yann LeCun an, um ein authentisches und umfassendes Intro zu erhalten. http://www.cs.nyu.edu/~yann/talks/lecun-ranzato-icml2013.pdf
quelle