Spezifische Anforderungen des Turing-Tests

9

Was sind die spezifischen Anforderungen des Turing-Tests?

Welche Anforderungen muss der Bewerter gegebenenfalls erfüllen, um für die Durchführung des Tests qualifiziert zu sein?
Müssen immer zwei Teilnehmer an der Konversation teilnehmen (ein Mensch und ein Computer) oder kann es mehr geben?
Sind Placebo-Tests (bei denen eigentlich kein Computer beteiligt ist) erlaubt oder empfohlen?
Kann es mehrere Bewerter geben? Wenn ja, muss die Entscheidung unter allen Bewertern einstimmig sein, damit die Maschine den Test bestanden hat?

intelligence-testing software-evaluation turing-test natural-language-processing Luke
quelle

9

Unter "Turing-Test" wird im Allgemeinen eine aktualisierte Version des Nachahmungsspiels verstanden, das Alan Turing in seinem gleichnamigen Artikel von 1951 vorgeschlagen hat. Eine frühe Version hatte einen Menschen (männlich oder weiblich) und einen Computer, und ein Richter musste entscheiden, welches welches ist und welches Geschlecht sie hatten, wenn sie menschlich waren. Wenn sie weniger als 50% korrekt waren, wurde der Computer als "intelligent" angesehen.

Die derzeit allgemein akzeptierte Version erfordert nur einen Teilnehmer und einen Richter, um zu entscheiden, ob es sich um einen Menschen oder eine Maschine handelt. Also ja, manchmal ist dies effektiv ein Placebo, wenn wir einen Menschen als Placebo betrachten.

Ihre erste und vierte Frage hängen zusammen - und es gibt keine strengen Richtlinien. Wenn der Computer eine größere Anzahl von Richtern täuschen kann, wird er natürlich als bessere KI angesehen.

Die Universität von Toronto hat einen Gültigkeitsabschnitt in diesem Artikel über Turing , der einen Link zu Jason Hutchens 'Kommentar darüber enthält, warum der Turing-Test möglicherweise nicht relevant ist (Menschen können ihn auch nicht bestehen), und den Loebner-Preis , eine formale Instanziierung eines Turing Prüfung .

Rory Alsop
quelle

2

Hier gibt es wirklich zwei Fragen, die ich sehen kann. Eine ist: "Was waren die spezifischen Anforderungen des ursprünglichen Turing-Tests, wie von Turing selbst angegeben?" Die andere lautet: "Was sollten die spezifischen Anforderungen eines modernen Turing-Tests sein?" Seit Turings Tag sind die Dinge sehr weit fortgeschritten, und ich denke, es ist vernünftig, dass wir erwägen, seinen Test zu erweitern / zu modifizieren, um unser aktuelles Verständnis widerzuspiegeln.

Die Antwort auf die erste Frage ist leicht zu finden, daher denke ich, dass die interessante die zweite ist. Wie sollte ein Test zur Bestimmung der Intelligenz aussehen? Vor diesem Hintergrund denke ich, dass die Antwort auf alle vier vom OP gestellten Fragen "es kommt darauf an" lautet. Ich glaube nicht, dass es einen allgemeinen Konsens darüber gibt, wie ein perfekter Turing-Test strukturiert werden kann, daher kann ein bestimmter Experimentator die Dinge wirklich frei einrichten, wie er / sie es will.

Dies alles basiert natürlich auf der Annahme, dass der Turing-Test oder ein Turing-Test-ähnlicher Test tatsächlich von Wert ist. Das ist nicht unbedingt selbstverständlich. Bedenken Sie, dass es sich in gewissem Maße um das Entwerfen einer KI mit einer außergewöhnlichen Fähigkeit zur Täuschung handelt! Das heißt, vorausgesetzt, der Fragesteller darf einfach fragen: "Bist du ein Mensch?", Müssen wir davon ausgehen, dass die KI lügen soll, wenn sie den Test bestehen will. Man könnte sich also zu Recht fragen: Ist das Entwerfen eines Systems, das wirklich gut darin ist, Lügen zu erzählen, ein wertvoller Ansatz für die KI?

Geisteskriminalität
quelle

0

Wenn Sie die Relativitätstheorie verstehen wollen, lesen Sie Einstein ^1,2 , kein Buch über Relativitätstheorie, das von einem Professor verfasst wurde, der glaubt, er habe es. Wenn Sie Alan Turings Intelligenztest im Kontext des menschlichen Dialogs verstehen möchten, lesen Sie Turing. ³ Interpretationen können schlechter als wertlos sein. Sie sind oft irreführend. Wenn die Prinzipien zu dick erscheinen, lesen Sie sie noch einmal durch, bis Sie sie erhalten.

Im Fall von Turings Intelligenztest im Kontext des menschlichen Dialogs wird, um ihn vollständig zu verstehen, der folgende Hintergrund angenommen, als Turing schrieb, was, wenn Sie seinen Artikel von 1950 lesen, offensichtlich wird.

Wie Turings Vollständigkeitssatz auf Kurt Gödels zweiten Unvollständigkeitssatz reagiert
Die Strategie eines kontrollierten Tests
Der Unterschied zwischen (a) Hören und Sprechen und (b) Zuhören und witzigem Reagieren - Dies ist heute besonders relevant, da die Chat-Bots (a) tun und zwischen 5 und 500 Jahre von (b) entfernt sein könnten. Um (c) tief zu verstehen und mit Inspiration zu reagieren, müssen KI-Forscher über die Modellierung des menschlichen Geistes hinausgehen und sich der Herausforderung stellen, den Geist von Menschen wie Gödel, Einstein und Turing zu modellieren. Ob dies jemals passieren wird, ist noch nicht bekannt.

Die spezifischen Anforderungen des Imitationsspiels, Alan Turings Untertitel über der Beschreibung seines Gedankenexperiments, sind aktenkundig.

Besondere Anforderungen [Auszug aus dem aktuellen Artikel]

[Das Nachahmungsspiel] wird mit drei Personen gespielt, einem Mann (A), einer Frau (B) und einem Vernehmer (C), die beide Geschlechter haben können. Der Vernehmer bleibt in einem Raum vor den beiden anderen. Ziel des Spiels für den Vernehmer ist es, festzustellen, welcher der beiden anderen der Mann und welcher die Frau ist. Er kennt sie unter den Bezeichnungen X und Y und sagt am Ende des Spiels entweder "X ist A und Y ist B" oder "X ist B und Y ist A." Der Vernehmer darf A und B folgende Fragen stellen:

C: Kann X mir bitte die Länge seiner Haare sagen?

Angenommen, X ist tatsächlich A, dann muss A antworten. Es ist das Ziel von A im Spiel, C dazu zu bringen, sich falsch zu identifizieren. Seine Antwort könnte daher sein:

"Mein Haar ist geschuppt und die längsten Strähnen sind ungefähr neun Zoll lang."

Damit Sprachtöne dem Vernehmer möglicherweise nicht helfen, sollten die Antworten geschrieben oder noch besser maschinengeschrieben werden. Die ideale Anordnung besteht darin, dass ein Fernschreiber zwischen den beiden Räumen kommuniziert. Alternativ können die Fragen und Antworten von einem Vermittler wiederholt werden. Das Ziel des Spiels für den dritten Spieler (B) ist es, dem Vernehmer zu helfen.

Die beste Strategie für sie ist wahrscheinlich, wahrheitsgemäße Antworten zu geben. Sie kann Dinge hinzufügen wie "Ich bin die Frau, hör nicht auf ihn!" auf ihre Antworten, aber es wird nichts nützen, da der Mann ähnliche Bemerkungen machen kann.

Wir stellen nun die Frage: "Was passiert, wenn eine Maschine in diesem Spiel die Rolle von A übernimmt?" Wird der Vernehmer so oft falsch entscheiden, wenn das Spiel so gespielt wird, wie wenn das Spiel zwischen einem Mann und einer Frau gespielt wird? Diese Fragen ersetzen unser Original: "Können Maschinen denken?"

Es gab Tausende von Kritiken sowohl zu Einsteins Relativitätstheorie als auch zu Turings Test, von denen keine viel Wert hinzufügt. Studieren Sie das Denken großer Mitwirkender durch ihre eigenen Worte, und alle folgenden Abfälle werden vor allem wegen ihrer mangelnden Größe interessant sein.

Sekundäre Fragen in diesem Thread

Welche Anforderungen muss der Bewerter gegebenenfalls erfüllen, um für die Durchführung des Tests qualifiziert zu sein?

Der Interrogator (C) ist kein Evaluator. Die Bewertung wäre ein Versuch, objektiv zu sein. Die Prämisse von Turings Gedankenexperiment ist jedoch, dass der Vernehmer ihr subjektives Urteil abgibt. Aus statistischer Sicht sollte der Vernehmer zufällig aus der Weltbevölkerung ausgewählt werden, die eine gesprochene Sprache mit (A) und (B) teilt.

Müssen immer zwei Teilnehmer an der Konversation teilnehmen (ein Mensch und ein Computer) oder kann es mehr geben?

Es müssen genau zwei vorhanden sein, um das von Alan Turing beschriebene Szenario zu erfüllen. (Siehe unten für weitere Details.)

Sind Placebo-Tests (bei denen eigentlich kein Computer beteiligt ist) erlaubt oder empfohlen?

Man könnte alle möglichen Dinge testen, und Forscher tun dies jedoch, was außerhalb des Rahmens von Turings Gedankenexperiment liegen würde. ⁴

Kann es mehrere Bewerter geben? Wenn ja, muss die Entscheidung unter allen Bewertern einstimmig sein, damit die Maschine den Test bestanden hat?

Was denjenigen, die ein tatsächliches Imitationsspiel sponsern, die meisten Informationen liefern würde, wäre ein doppelblinder, vollständig randomisierter Test, bei dem (A), (B) und (C) einer Stichprobe dieser Männer, Frauen oder Software als zufällig entnommen werden Systeme des zu testenden Typs, die sich in einer gemeinsamen Sprache unterhalten können, und der Test würde viele Male mit zufälliger Auswahl aus den Stichproben ausgeführt.

Einstimmigkeit, Bewertung, zusätzliche Komplexität und andere Kommunikation als die im Test angegebene würden die Ursache nur vereiteln, wenn man an Turings ursprünglicher Absicht bezüglich der Frage festhält: "Können Computer denken?"

Andere Ansichten der Intelligenz

Turing und René Descartes, der erklärte, dass Maschinen niemals eine weniger kontrollierte Version von Turings Imitationsspiel bestehen werden, sahen Intelligenz durch die Linse des Dialogs. Andere haben andere Arten von Dialogen und andere Kontexte als Dialoge betrachtet. Ich habe dies in einer anderen Frage angesprochen:

Kann ein Gehirn ohne Körper intelligent sein?

Referenzen und Fußnoten

[1] Relativitätstheorie: Das Besondere und die Allgemeine Theorie von Albert Einstein, 1916

[2] Das Relativitätsprinzip von Albert Einstein und Francis A. Davis, 1923

[3] AM Turing (1950) Computing Machinery and Intelligence. Mind 49: 433-460. https://www.csee.umbc.edu/courses/471/papers/turing.pdf

[4] Turings Artikel aus dem Jahr 1950 empfahl nicht, sein Gedankenexperiment für die kommerzielle Validierung zukünftiger KI-Systeme zu verwenden. Alan Turing befasste sich jedoch zu einem bestimmten Zeitpunkt seiner Karriere mit praktischem Computing. Zu diesem Zeitpunkt hatten die Nazis Frankreich überrannt, sein Heimatland aus der Luft pulverisiert und mit Hilfe der Enigma-Kryptographie einen bedeutenden Teil der englischen Marine von unten versenkt.

Douglas Daseeco
quelle

Spezifische Anforderungen des Turing-Tests

Antworten: