Es scheint, dass die meisten Projekte versuchen, der KI beizubringen, einzelne, spezifische Sprachen zu lernen.
Mir fällt ein, dass es in geschriebenen und gesprochenen Wörtern und Phrasen sprachübergreifende Beziehungen gibt - die meisten Benutzer haben es viel leichter, mehr Sprachen zu lernen, nachdem wir eine zweite Sprache gelernt haben, und wir beginnen, die Beziehungen zwischen Wörtern und Phrasen in verschiedenen Sprachen zu verstehen .
Hat jemand versucht, eine KI zu trainieren, um alle Sprachen zu lernen ?
Wäre dies nicht möglicherweise ein viel einfacheres Problem als der Versuch, einer KI eine einzige, spezifische Sprache mit allen Einzelheiten und Details dieser einzelnen Sprache beizubringen? Da Sie tatsächlich viele verwandte Daten in anderen Sprachen aus dem Trainingssatz weglassen?
quelle
Antworten:
Es gibt Ansätze in der maschinellen Übersetzung, die versuchen, diese Art von Synergie zwischen Sprachen zu erfassen. Die Idee ist, dass wenn Sie Ihre Architektur so trainieren, dass sie Englisch-Japanisch, Japanisch-Englisch, Koreanisch-Englisch, Englisch-Koreanisch übersetzen kann, sie auch von Japanisch nach Koreanisch übersetzen kann, ohne jemals ein einziges solches Trainingsbeispiel gesehen zu haben. Hier können Sie über diese sogenannte Zero-Shot-Übersetzung lesen.
Es ist auch möglich, Wortvektoren in mehreren Sprachen gleichzeitig zu trainieren , wodurch Sie möglicherweise bessere Wortvektoren für eine Sprache mit wenigen Trainingsbeispielen erhalten.
Natürlich müssen Sie für ein echtes Sprachverständnis das Grundproblem lösen , und ich bin mir nicht sicher, ob die Verwendung mehrerer Sprachen dabei helfen wird.
quelle