Angenommen, Sie haben (vor der One-Hot-Codierung) Prädiktoren / Felder aus einem Satz ( z . B. Filmgenre, Geschlecht des Benutzers und Benutzerrasse). Angenommen, jeder Prädiktor z ∈ Z kann einen von k z Werten annehmen . Nach der One-Hot-Codierung erhalten Sie einen neuen Satz von Binärmerkmalen X der Größe K : = ∑ z ∈ Z k zZ.z∈ Z.kzX.K.: = ∑z∈ Z.kz .
In einem Modell mit allen Wechselwirkungen müssen Sie eine Matrix von Wechselwirkungskoeffizienten mit K × ( K + 1 ) schätzen.Q. eindeutige Terme enthält.K×(K+1)/2
Die Faktorisierungsmaschine strukturiert die Matrix und nimmt an, dass Q ≡ W T W ist , wobei W die Dimension l × K hat , wobei 1 ≤ l ≤ K eine vom Benutzer angegebene Zahl ist. Wir schätzen , W anstelle von Q .QQ≡WTWWl×K1≤l≤KW.Q.
Das Feld bewusst Faktorisierung Maschine legt Struktur auf als auch. Es unterteilt Q in Blöcke basierend auf z (den ursprünglichen Merkmalen). Wenn q z i , z j den z i , z j -Block von Q bezeichnet , nehmen wir an, dass q z i , z j aus dem z i , z j -Block von W T j W i stammt , wobei W i die Dimension l hat ×Q.Q.zqzich, zjzich, zjQ.qzich,zjzich, zjW.T.jW.ichW.ichl × K.W.ichQ.
Q.K.× lK.× l × | Z.|K.× (( K.+ 1 ) / 2 Parameter.