Hat 'Eugene Goostman' den Turing-Test wirklich bestanden?

18

Es heißt, dass "Eugene Goostman", ein Computerprogramm, das entwickelt wurde, um einen 13-jährigen Jungen zu simulieren, es geschafft hat, 33 Prozent der Richter davon zu überzeugen, dass es sich um einen Menschen handelt, und damit den Turing-Test bestanden hat.

Das Computerprogramm, auch bekannt als Chatbot, gab vor, ein 13-jähriger ukrainischer Junge zu sein, für den Englisch eine zweite Sprache war - etwas ganz anderes.

Für mich klingt Eugene genau so, wie es ein mittelmäßiger Chatbot tun sollte: repetitiv, unsinnig und übersät mit Nicht-Sequituren. Ich weiß nicht, wie es die (unprofessionell erscheinenden) Richter überzeugt hat.

Viele Leute haben Eugene kritisiert, wie Prof. Stevan Harnad, der sagte: "Es ist Unsinn" und "Wir haben den Turing-Test nicht bestanden. Wir sind nicht einmal nah dran."

Meinungsverschiedenheiten, aber ich würde wirklich gerne wissen, ob es den Test offiziell bestanden hat?

Es wird auch gesagt, dass:

Zwei einmalige Preise, die noch nie vergeben wurden. 25K wird für den ersten Chatterbot angeboten, den Richter nicht von einem echten Menschen unterscheiden können und der Richter davon überzeugen kann, dass der Mensch das Computerprogramm ist. 100.000 US-Dollar sind die Belohnung für den ersten Chatterbot, den Richter in einem Turing-Test, der das Entschlüsseln und Verstehen von Texten, visuellen und akustischen Eingaben umfasst, nicht von einem echten Menschen unterscheiden können. Sobald dies erreicht ist, endet der jährliche Wettbewerb.

Bedeutet das, dass Eugene 25.000 US-Dollar gewonnen hat?

George Chalhoub
quelle
2
Es ist sehr wichtig, dass die Richter wissen, dass sie in der Lage sind.
Thorbjørn Ravn Andersen
3
2/3 der Richter meinten, dieser Bot sei kein Mensch. Für mich heißt das, dass die künstliche Natur dieser Interaktion für mehr als die Mehrheit der Richter offensichtlich war. Ich würde das ein klares Versagen nennen. (Und selbst wenn "Eugene" "gewonnen" hat - wie kann eine künstliche Person echtes Geld sammeln? BitCoin ?:-)
Bob Jarvis - Monica
Können Sie ein Beispielgespräch geben? Ich interagiere täglich mit Ukrainern und die Art und Weise, wie sie Englisch sprechen, ist leicht zu erkennen.
Stephan Bijzitter

Antworten:

18

Es gibt keinen "offiziellen Turing-Test", daher gibt es kein Konzept, den Test "offiziell zu bestehen". Turing beschrieb eine Methode, mit der man künstliche Intelligenzen bewerten könnte. Die Organisatoren der Veranstaltung, die Eugene Goostman gewonnen hat, haben diese Methode auf besondere Weise umgesetzt, und das Programm entsprach den Kriterien, die die Organisatoren ausgewählt hatten. In diesem Sinne hat es den Test bestanden.

Da es keinen "offiziellen Turing-Test" gibt, könnte es sinnvoller sein zu sagen, dass Eugene Goostman einen Turing-Test oder sogar einen Turing-Test bestanden hat. Es ist unwahrscheinlich , dass die Medien auf solche Feinheiten abholen würde, zumal Turings Ruhm und die Idee „ der Turing - Test“ im öffentlichen Bewusstsein.

David Richerby
quelle
3
Außerdem würde Eugene Goostman bei Turings ursprünglichem Imitationsspiel Müll sein ;-)
Steve Jessop
9

Ich denke, die Preise, auf die Sie sich beziehen, sind die Loebner-Preise . Laut Wikipedia-Seite (siehe vorherigen Link) ist der Gewinner für 2014 "Rose" von Bruce Wilcox. Dieses Programm hat keinen der einmaligen Preise gewonnen, aber ein Preisgeld von 4.000 US-Dollar erhalten. "Eugene Goostman" trat 2005 und 2008 an und wurde beide Male Zweiter.

Der gewonnene Wettbewerb „Eugene Goostman“ wurde von Kevin Warwick von der Coventry University anlässlich des 60. Jahrestages des Todes von Alan Turing organisiert. Ich kenne kein Preisgeld.

Schauen Sie sich Ray Kurzweils Sicht auf den Wettbewerb und das fragliche Programm an. Auszug:

Professor Warwick behauptet, der Test sei "uneingeschränkt". Der Chatbot sei jedoch ein 13-jähriges Kind, für das Englisch keine Muttersprache ist. Darüber hinaus waren die Wechselwirkungen Berichten zufolge auf jeweils fünf Minuten begrenzt. Es ist sehr wahrscheinlich, dass in so kurzer Zeit naive Richter getäuscht werden.

Ich unterhielt mich mit dem Chatbot Eugene Goostman und war nicht beeindruckt. Eugene verfolgt das Gespräch nicht, wiederholt sich Wort für Wort und antwortet oft mit typischen Chatbot-Non-Sequituren.

Ich fand auch, dass dies ein netter Kommentar ist: WIRED - Dieser Computer hat tatsächlich ein F im Turing-Test

Eric Hughes
quelle
1
Ich mochte das Kabelgebundene auch, insbesondere "In einem Wettbewerb von 1991 konnte ein Bot namens PC-Therapeut fünf von zehn Richtern davon überzeugen, dass es ein Mensch ist." Auch in Bezug auf die "spezielle" Täuschungsschwelle von> 30%: "Der Vater des Turing-Tests verwendete diese Schwelle also nicht als Intelligenzschwelle. Er sagte lediglich voraus, wo er Computer für fünf Jahrzehnte in der Zukunft halten würde. "
Fizz
10
Zusammenfassend: Der Eugene-Bot "bestand" diesen Test nicht, indem er die menschliche Intelligenz simulierte, sondern indem er die menschliche Dummheit simulierte.
Duskwuff
2

Hinzufügen eines Wikipedia-Links für mehr Tiefe zum "ursprünglichen" Turing-Test. Es gibt viele Tests, die als "Turing-Test" bezeichnet werden. Wikipedia erwähnt "mindestens 3 Primärversionen". Der von Eugeene bestandene Test ist keiner von diesen 3. Der von Eugeene bestandene Test wurde nicht von Alan Turing entwickelt, sondern es war ein Test namens Turing-Test, der von Alan Turing inspiriert wurde, und Eugeene bestand ihn.

Der Teil, der mindestens drei Hauptversionen des Turing-Tests enthält:

Saul Traiger argumentiert, dass es mindestens drei Hauptversionen des Turing-Tests gibt, von denen zwei in "Computing Machinery and Intelligence" angeboten werden und eine, die er als "Standardinterpretation" bezeichnet. Zwar wird diskutiert, ob es sich bei der "Standardinterpretation" um die von Turing beschriebene handelt oder um eine Fehlinterpretation seiner Arbeit. Diese drei Versionen werden jedoch nicht als gleichwertig angesehen, und ihre Stärken und Schwächen sind unterschiedlich.

Version 1

Turings ursprüngliches Spiel beschrieb ein einfaches Partyspiel mit drei Spielern. Spieler A ist ein Mann, Spieler B ist eine Frau und Spieler C (der die Rolle des Vernehmers spielt) ist von beiden Geschlechtern. Im Imitationsspiel kann Spieler C weder Spieler A noch Spieler B sehen und nur durch schriftliche Notizen mit ihnen kommunizieren. Durch Fragen an Spieler A und Spieler B versucht Spieler C festzustellen, welcher der beiden der Mann und welcher die Frau ist. Die Aufgabe von Spieler A besteht darin, den Vernehmer zu einer falschen Entscheidung zu verleiten, während Spieler B versucht, den Vernehmer beim Treffen der richtigen Entscheidung zu unterstützen.

Version 2

Die zweite Version erschien später in Turings Arbeit von 1950. Ähnlich wie beim Original Imitation Game Test wird die Rolle von Spieler A von einem Computer ausgeführt. Die Rolle des Spielers B wird jedoch eher von einem Mann als von einer Frau ausgeübt. [...] In dieser Version versuchen sowohl Spieler A (der Computer) als auch Spieler B, den Vernehmer zu einer falschen Entscheidung zu verleiten.

Version 3

Nach allgemeinem Verständnis besteht der Zweck des Turing-Tests nicht darin, genau zu bestimmen, ob ein Computer in der Lage ist, einen Vernehmer zum Glauben zu verleiten, dass es sich um einen Menschen handelt, sondern ob ein Computer einen Menschen imitieren könnte. Zwar ist umstritten, ob diese Interpretation von Turing beabsichtigt war - Sterrett glaubt, dass dies die zweite Version war und widerspricht dieser, während andere, wie etwa Traiger, dies nicht tun -, was dennoch dazu geführt hat, dass " Standardinterpretation. " In dieser Version ist Spieler A ein Computer und Spieler B eine Person beiderlei Geschlechts. Die Rolle des Vernehmers besteht nicht darin, zu bestimmen, wer männlich und wer weiblich ist, sondern welcher ein Computer und welcher ein Mensch ist. Das grundlegende Problem bei der Standardinterpretation ist, dass der Interrogator nicht unterscheiden kann, welcher Responder menschlich und welcher maschinell ist. Es gibt Probleme hinsichtlich der Dauer, aber die Standardinterpretation betrachtet diese Einschränkung im Allgemeinen als etwas, das vernünftig sein sollte.

Im Gegensatz dazu unterhielten sich menschliche Richter bei dem von Eugeene bestandenen Test 5 Minuten lang mit einem Chatbot. Danach mussten sie entscheiden, ob es sich um einen Bot handelte oder nicht.

Peter - Unban Robert Harvey
quelle
0

Ja, es hat "einen" Turing-Test gewonnen, der so genau wie möglich der ursprünglichen Beschreibung von Alan Turing entsprach.
Dies war jedoch nicht die mit 25.000 US-Dollar dotierte Version des Loebner-Preises, deren Spezifikationen von der Beschreibung von Alan Turing abweichen.
Noch wichtiger ist, Alan Turing meinte nie, dass dies ein echter Test ist. Das Ergebnis ist also kein Beweis für Intelligenz, wenn Sie das tatsächlich wissen wollten.

Don Patrick
quelle