Gibt es moderne Techniken zum Generieren von textuellen CAPTCHA-Herausforderungen (daher muss die Person den richtigen Text eingeben), die die KI mit einigen visuellen Verschleierungsmethoden leicht täuschen können, aber gleichzeitig vom Menschen ohne Probleme gelöst werden können?
Ich spreche zum Beispiel von der einfachen Fähigkeit , in ein Bild eingebetteten Text zu erkennen (ohne externe Plugins wie Flash oder Java, Bildklassifizierung usw. zu berücksichtigen) und den geschriebenen Text oder ähnliches erneut einzugeben.
Ich denke, das Hinzufügen von Rauschen, Farbverläufen, rotierenden Buchstaben oder das Ändern von Farben sind keine zuverlässigen Methoden mehr, da sie schnell unterbrochen werden können.
Irgendwelche Vorschläge oder Recherchen wurden gemacht?
quelle
Antworten:
Es ist eine interessante Frage, was Menschen einzigartig macht. Zu diesem Thema gibt es ein gutes Buch mit dem Titel What Computers Cant Do von Hubert Dreyfus .
Eine Aufgabe, die ein Computer (zumindest vorerst) nicht bewältigen kann, ist das Ranking wichtiger Dinge. Zum Beispiel fordert CAPTCHA Sie auf, eine zufällige Liste von Dingen (kleine, fünf oder sechs Elemente) nach Wichtigkeit zu ordnen. Diese spezielle Übung erfordert, dass die KI Entscheidungen trifft (nicht immer rational), die auf menschlichem Urteilsvermögen beruhen.
quelle
Eine Methode, die möglicherweise funktionieren könnte, besteht darin, optische Täuschungen zu verwenden, z. B. eine, bei der zwei Linien in einem Flur identisch sind, eine jedoch für das menschliche Auge länger erscheint. Dann könnten sie mit einer Multiple-Choice-Frage nach dem Zustand der Linie aufgefordert werden Unsere Augen sehen länger aus, aber für einen Computer ist die Länge der Linie immer noch gleich. Natürlich gibt es immer das Problem, dass Menschen mit Augenbehinderungen nicht in der Lage sind, sie zu vervollständigen, aber verschiedene Illusionen könnten verwendet werden, um dem Rechnung zu tragen.
Beispiel
quelle
Lassen Sie den Benutzer Objekte im Video markieren, die ein Klassifizierer nach dem Stand der Technik nicht lösen kann
Erstellen Sie einen hochmodernen Videoklassifikator. Könnte es auch auf Googles YouTube-8M- Videotrainingsdaten trainieren. Sie sollten aber auch das Originalvideo kontinuierlich füttern.
Lassen Sie den Klassifizierer so viele Objekte wie möglich beschriften. Lassen Sie es isolieren, welche Objekte es als Objekte erkennen kann, die es jedoch nicht beschriften kann.
Lassen Sie Videos ausgeben, die die Objekte umreißen. Vorzugsweise GIFs, die leicht in Formulare eingebettet werden können.
Fragen Sie für 100 davon 100 Benutzer, was das Objekt ist. Wenn 90% der Benutzer dem Namen eines Objekts zustimmen, fügen Sie dieses Video dem Captcha-Set hinzu. Nennen Sie dies das vorgefertigte Set.
Zeigen Sie einem Benutzer jedes Mal, wenn er sich authentifizieren muss, eines der hervorgehobenen Objekte in einem Video, das nicht aus dem vorab trainierten Satz stammt . Wenn das Bild weniger als 100 Anzeigen enthält, zeichnen Sie das Etikett auf und geben Sie dem Benutzer ein anderes aus dem vorab trainierten Satz. Wenn sie es richtig machen, lassen Sie sie durch, wenn nicht, geben Sie ihnen eine andere aus dem vorgeübten Set.
Wenn das nicht vorab trainierte Video mehr als 100 Vorführungen hat und mehr als 90% der Captcha-Benutzer zustimmen, fügen Sie dieses Video dem nachab trainierten Set hinzu.
Entfernen Sie im Laufe der Zeit langsam das vorab trainierte Set. Fügen Sie jedem Video im Post-Training-Set Ablaufzeiten hinzu und entfernen Sie sie nach Ablauf, damit sie nicht zu oft verwendet werden.
Im Idealfall würde dieser Prozess den Videoklassifizierer ständig verbessern, ihn auf dem neuesten Stand der Technik halten und anderen Klassifizierern etwas voraus sein. Vielleicht könnte es auch weniger gebräuchliche Wörter und Objekte und eher esoterische Dinge bevorzugen, um diesen Klassifikator gegen andere Klassifikatoren zu spezialisieren.
Das Gleiche könnte für die Bildbeschriftung getan werden, aber die Nützlichkeit des Videoklassifikators wird angesichts der Fortschritte in der KI wahrscheinlich länger dauern.
Genau genommen gibt es jedoch kein Captcha-System, das eines Tages nicht von externen KI-Systemen gelöst werden kann.
(Bearbeiten: Oh, ich habe gerade bemerkt, dass Sie ausdrücklich "Text-Captcha" gesagt haben. Wenn Sie das meinen, dann glaube ich nicht, dass die Textklassifizierung noch viel Rätsel aufwirft. Computer können jetzt wahrscheinlich Text aus Bildern besser als Menschen abrufen. Technisch gesehen erfolgt die Eingabe in das oben beschriebene Captcha-System jedoch in Textform.)
quelle