Ich weiß, dass eine neuronale Netzwerkarchitektur hauptsächlich auf dem Problem selbst und den Arten der Eingabe / Ausgabe basiert, aber dennoch - es gibt immer eine "quadratische", wenn mit der Erstellung begonnen wird. Meine Frage lautet also: Gibt es bei einem Eingabedatensatz von MxN (M ist die Anzahl der Datensätze, N ist die Anzahl der Features) und C möglichen Ausgabeklassen eine Faustregel für die Anzahl der Ebenen / Einheiten, mit denen wir beginnen sollen?
neural-network
shakedzy
quelle
quelle
Antworten:
Diese Frage wurde in CrossValidated ausführlich beantwortet: Wie wählt man die Anzahl der verborgenen Schichten und Knoten in einem vorwärtsgerichteten neuronalen Netzwerk?
Lassen Sie mich jedoch meine eigenen zwei Cent hinzufügen:
Es gibt keine magische Regel für die Auswahl der besten neuronalen Netzwerkarchitektur. Wenn Sie jedoch eine Architektur finden, mit der jemand ein ähnliches Problem gelöst hat, ist dies häufig ein hervorragender Ausgangspunkt.
Am besten suchen Sie nach offiziellen oder inoffiziellen Beispielen, die gängige Bibliotheken für neuronale Netze wie Keras, PyTorch oder Tensorflow verwenden, sowie Architekturen, die in der akademischen Literatur beschrieben sind. Keras / Beispiele auf Github sind eine großartige Ressource.
Diese Architekturen wurden wahrscheinlich nach vielen Versuchen und Irrtümern ausgewählt, sodass der größte Teil der Arbeit für Sie erledigt wurde.
quelle
Ich las einen Artikel über die Idee, neuronale Netze zum Entwerfen anderer neuronaler Netze zu verwenden, indem ich untersuchte, welche Konfiguration von Knoten und Schichten am effizientesten war. Auf dieser Seite können Sie ein PDF herunterladen: https://arxiv.org/abs/1611.02120
quelle
Nach der Antwort von @ Imran fand ich dieses Papier in einem der Kommentare des CrossValidated-Posts, auf den er verlinkt hat. Neben dem Versuch, mithilfe genetischer Modelle (anstelle einer Faustregel) die richtige Architektur zu finden, gibt Abschnitt 2.1 einige theoretische Grenzen für die Anzahl der verborgenen Einheiten in einem System mit einer oder zwei verborgenen Schichten.
EDIT: Ich habe diesen Satz getestet und herausgefunden, dass die Verwendung genetischer Modelle genauso gut ist wie die Auswahl einer zufälligen Architektur.
quelle