Ich versuche zu verstehen, wie Boltzmann-Maschinen funktionieren, bin mir aber nicht sicher, wie Gewichte gelernt werden, und habe keine eindeutige Beschreibung gefunden. Ist das Folgende richtig? (Auch Hinweise auf gute Boltzmann-Maschinenerklärungen wären toll.)
Wir haben eine Reihe von sichtbaren Einheiten (z. B. entsprechend schwarz / weißen Pixeln in einem Bild) und eine Reihe von versteckten Einheiten. Die Gewichte werden auf irgendeine Weise initialisiert (z. B. einheitlich von [-0,5, 0,5]), und dann wechseln wir zwischen den folgenden beiden Phasen ab, bis eine Stoppregel erreicht ist:
Clamped-Phase - In dieser Phase sind alle Werte der sichtbaren Einheiten festgelegt, sodass nur die Zustände der ausgeblendeten Einheiten aktualisiert werden (gemäß der stochastischen Boltzmann-Aktivierungsregel). Wir aktualisieren, bis das Netzwerk das Gleichgewicht erreicht hat. Sobald wir das Gleichgewicht erreicht haben, aktualisieren wir weitere Male (für einige vordefinierte N ), wobei wir den Durchschnitt von x i x j verfolgen (wobei x i , x j die Zustände der Knoten i und j sind ). Nach diesem N Gleichgewicht Updates aktualisieren wir w i j = w i j +, wobeiCeine Lernrate ist. (Oder, anstatt am Ende eine Stapelaktualisierung durchzuführen, aktualisieren wir nach dem Gleichgewichtsschritt?)
Freie Phase - In dieser Phase werden die Zustände aller Einheiten aktualisiert. Sobald wir das Gleichgewicht erreicht haben, aktualisieren wir auf ähnliche Weise N 'mehrmals, aber anstatt am Ende Korrelationen hinzuzufügen, subtrahieren wir: .
Meine Hauptfragen sind also:
Wenn wir uns in der Klemmphase befinden, setzen wir die sichtbaren Einheiten auf eines der Muster zurück, die wir lernen möchten (mit einer Frequenz, die die Wichtigkeit dieses Musters darstellt), oder lassen wir die sichtbaren Einheiten in dem Zustand, in dem sie sich befanden am Ende der freien Phase?
Führen wir am Ende jeder Phase eine Stapelaktualisierung der Gewichte durch oder aktualisieren wir die Gewichte bei jedem Gleichgewichtsschritt in der Phase? (Oder ist einer in Ordnung?)
quelle