Ich möchte einen Bot trainieren, der Texteingabe verwendet, einige Kategorien auswendig lernt und Fragen entsprechend beantwortet. Zusätzlich möchte ich als Version 2.0 den Bot dazu bringen, auch Spracheingaben zu beantworten. Welches sind die neuesten Algorithmen für maschinelles Lernen / KI? Lass es mich wissen, bitte.
machine-learning
algorithm
chat-bots
Bharadwaj Aldur
quelle
quelle
Antworten:
Ihre Frage ist unglaublich weit gefasst. Als Antwort möchte ich Sie bitten, zwei allgemeine Rahmenbedingungen zu betrachten:
quelle
Wenn sich Ihr Bot an wenige Kategorien "erinnert" und dann die Fragen beantwortet, ist dies im aktuellen Szenario völlig nutzlos. weil es in diesem Fall bei einem anderen Datensatz (Test-Set) sehr schlecht abschneidet. In der Statistik-Terminologie wird es als "Überanpassung" bezeichnet. Bei der Beantwortung von Fragen gibt es keine Faustregel, um "State-of-Art" -Algorithmen zu definieren. Sie können jedoch einige Modelle überprüfen, die bei Babi oder ähnlichen Datensätzen eine gute Leistung zeigten, z. B. dynamische Speichernetzwerke oder seQ2seQ-Modelle. Um eine grundlegende Vorstellung von diesem Bereich zu bekommen, würde ich Ihnen empfehlen, die grundlegende Umgangssprache des maschinellen Lernens zu lernen und dann zu einem Kurs zur Verarbeitung fortgeschrittener natürlicher Sprachen überzugehen (Stanford bietet CS224N an).
quelle
Bundesstaat AbuShawar & Atwell:
Ihre und andere Artikel vermitteln einige der vielen zeitgenössischen Ansätze für das Chatbot-Training zum Zeitpunkt dieses Schreibens.
Automatische Extraktion von Chatbot-Trainingsdaten aus Natural Dialogue Corpora , Bayan AbuShawar, Eric Atwell, 2016
Auswahl kontextunsicherer Chatbot-Aktionen durch parametrisiertes Lernen zur zusätzlichen Verstärkung , Chuandong Yin, Rui Zhang, Jianzhong Qi, Yu Sun und Tenglun Tan, 2018
Training für überwachtes Lernsystem unter Verwendung von Chatbot-Interaktion , US-Patentanmeldungsveröffentlichung 0034828 A1, International Business Machines Corporation, Armonk, NY, USA, 2019
Zweistufiges Training und gemischte Codierung-Decodierung zur Implementierung eines generativen Chatbots mit einem kleinen Dialogkorpus , Jintae Kim, Hyeon-Gu Lee, Harksoo Kim, Yeonsoo Lee, Young-Gil Kim, 2016
Submodularitätsinspirierte Datenauswahl für zielorientiertes Chatbot-Training basierend auf Satzeinbettungen , Mladen Dimovski, Claudiu Musat, Vladimir Ilievski, Andreea Hossmann, Michael Baeriswyl, 2018
quelle
Sie können mit wiederkehrenden neuronalen Netzen mit LSTM oder GRU als Speicherzellen und Worteinbettungen wie Word2vec arbeiten. Strahlensuch- und Aufmerksamkeitsmodelle können auch mit den RNNs für mehr Robustheit und weniger Vorspannung verwendet werden. Die Ergebnisse sind jedoch nur bis zu einem gewissen Grad spürbar, da die Forschung auf diesem Gebiet noch heiß ist und noch viel zu enträtseln ist.
quelle