Eine Möglichkeit zum Generieren von Worteinbettungen ist die folgende ( Spiegelung ):
- Holen Sie sich eine Korpora, zB "Ich fliege gerne. Ich mag NLP. Ich mag tiefes Lernen."
- Erstellen Sie daraus das Wort Cooccurrence Matrix:
- Führen Sie SVD für durch und behalten Sie die ersten Spalten von U bei.
Zwischen den Schritten 2 und 3 werden manchmal punktweise gegenseitige Informationen angewendet (z . B. A. Herbelot und EM Vecchi. 2015. Aufbau einer gemeinsamen Welt: Abbildung der Verteilung auf modelltheoretische semantische Räume . In Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing Lissabon, Portugal .).
Was sind die Vor- und Nachteile der Anwendung punktueller gegenseitiger Informationen auf eine Wortkoexistenzmatrix vor der SVD?
quelle