Word2Vec vs.

18

Ich kam vor kurzem in den Bedingungen Word2Vec , Sentence2Vec und Doc2Vec und Art verwirrt wie ich bin neu in Vektor - Semantik. Kann jemand bitte die Unterschiede in diesen Methoden in einfachen Worten erläutern. Was sind die am besten geeigneten Aufgaben für jede Methode?

Schmied
quelle

Antworten:

22

Nun, die Namen sind ziemlich einfach und sollten Ihnen eine klare Vorstellung von Vektordarstellungen geben.

Der Word2Vec-Algorithmus erstellt eine verteilte semantische Darstellung von Wörtern. Es gibt zwei Hauptansätze für das Training: Distributed Bag of Words und das Skip-Gram-Modell. Eine beinhaltet das Vorhersagen der Kontextwörter unter Verwendung eines zentralen Wortes, während die andere das Vorhersagen des Wortes unter Verwendung der Kontextwörter beinhaltet. Sie können darüber in Mikolovs Aufsatz ausführlich lesen .

Dieselbe Idee kann auf Sätze und vollständige Dokumente ausgedehnt werden, wobei statt der Darstellung von Merkmalen für Wörter diese für Sätze oder Dokumente erlernt werden. Um jedoch einen allgemeinen Überblick über einen Satz zu erhalten, betrachten Sie ihn als mathematischen Durchschnitt der Wortvektordarstellungen aller Wörter im Satz. Sie können eine sehr gute Annäherung erhalten, indem Sie nur den Durchschnitt bilden und keinen SatzToVec trainieren, aber das hat natürlich seine Grenzen.

Doc2Vec erweitert die Idee von SatzToVec bzw. Word2Vec, da Sätze auch als Dokumente betrachtet werden können. Die Idee des Trainings bleibt ähnlich. Sie können Mikolov des Doc2Vec lesen Papier für weitere Details.

Zu den Anwendungen zu kommen, würde es von der Aufgabe abhängen. Ein Word2Vec erfasst effektiv semantische Beziehungen zwischen Wörtern und kann daher zur Berechnung von Wortähnlichkeiten verwendet oder als Merkmal für verschiedene NLP-Aufgaben wie die Stimmungsanalyse usw. verwendet werden nicht nur Worte. Wenn Sie beispielsweise herausfinden möchten, ob zwei Stapelüberlauffragen Duplikate voneinander sind.

Eine einfache Google-Suche führt Sie zu einer Reihe von Anwendungen dieser Algorithmen.

Himanshu Rai
quelle
Was ist der Unterschied zwischen der Mittelung von Wortvektoren und der Verwendung von doc2vec? Berücksichtigt doc2vec die Umgebung eines Wortes im Satz, während der Vektor erstellt wird (während word2vec dies nicht tut)?
John Strood
1
Doc2Vec lernt einen zufällig initialisierten Vektor für das Dokument zusammen mit den Wörtern (Dokument könnte ein Satz sein). Die manuelle Mittelwertbildung von Wortvektoren erreicht nicht dieselbe Kapazität, da sie nicht aus dem gesamten Dokument lernen kann. In letzter Zeit wurden Paragram-Vektoren bei der Arbeit mit Dokumentenähnlichkeiten usw. extrem verwendet.
Himanshu Rai