Aus DeepMinds Forschungsbericht auf arxiv.org:
In diesem Artikel wenden wir einen ähnlichen, aber vollständig generischen Algorithmus, den wir AlphaZero nennen , auf die Spiele Schach und Shogi sowie Go an, ohne zusätzliche Domänenkenntnisse außer den Spielregeln, was zeigt, dass es sich um ein allgemeines Verstärkungslernen handelt Algorithmus kann, tabula rasa, übermenschliche Leistung in vielen herausfordernden Bereichen erreichen.
Bedeutet dies, dass AlphaZero ein Beispiel für AGI (Artificial General Intelligence) ist?
quelle
Annahmen, die möglicherweise falsch sind
Im Ton des Papiers sind zwei Annahmen erkennbar.
In der Frage sind zwei weitere identifizierbar.
Alle vier mögen wahr sein, aber keiner der vier ist sicher.
Produktivität von AlphaZero
Wenn sich unser Schachbrett im Spielregal in unserem Schrank befindet, unser Gras lang ist und unser Rasenmäher kaputt ist, würde AlphaZero, wenn es mit einem humanoiden Roboter verbunden ist, keine Spielregeln für die Tasksequenz codieren.
Daher ist es für uns in diesem Szenario von keinem besonderen Verbraucherwert. Nicht sehr allgemein.
Selbst wenn es den Rasen mit einem bereits funktionierenden Rasenmäher mähen könnte, wäre es von Wert, was nicht die Fähigkeit erfordert, etwas zu gewinnen, sondern die Fähigkeit, zu gehorchen und die untermenschliche Intelligenz zu zeigen, die erforderlich ist, um nicht über das Blumenbeet zu rennen.
Es ist bemerkenswert, dass die klugen Leute von DeepMind die lateinische Tabula Rasa anstelle einer leeren Tafel gewählt haben, aber nicht annähernd so beeindruckend wie die Erstellung eines Lernprogramms, das lernen kann, drei Spiele gut zu spielen, wobei nur die codierten Regeln und das tatsächliche Spiel als Eingabe verwendet werden.
Um diese Spielprogramme in einem Produktbereich als wirklich nützlich zu betrachten, kann man sich nicht auf ein anhaltendes Interesse am Kauf von Software verlassen, die den Käufer jedes Mal schlägt. Damit KI-Produkte funktionsfähig sind, müssen die Lernfunktionen in der Lage sein, umgangssprachlich den gesunden Menschenverstand zu nennen, was ein viel breiteres und flexibleres Domänenwissen erfordert als die festgelegten Spielregeln. Wir können davon ausgehen, dass die meisten Forscher, die Meilensteine beim Gewinnen des Gameplay-Lernens erreicht haben, in diese Richtung drängen. Auch sie wissen, dass ihre Forschungsergebnisse irgendwann produziert werden müssen oder zu einem käuflichen SaaS-Angebot führen müssen.
Für diejenigen außerhalb des Fachgebiets wäre es beeindruckend, wenn diese Fortschritte im Bereich des Rechenzentrums umgeleitet werden könnten, um Gentherapien zur Heilung von Krebs oder Herpes oder zur Umkehrung von Diabetes oder Alzheimer zu generieren. Dann könnten wir den Forschern verzeihen, dass sie uns keinen Download zur Verfügung gestellt haben, mit dem sie einen Roboter zur Reinigung unseres Badezimmers als Marionettenmeister einsetzen könnten. Aus dem Papier geht nicht hervor, dass AlphaZero hinreichend nachgewiesen hat, dass es "übermenschliche Leistung in vielen herausfordernden Bereichen" aufweist.
Was sie getan haben, ist immer noch beeindruckend und in der Richtung, in der auch andere Fortschritte gemacht haben. Nur wenige von uns würden es wagen, ein Spiel zu erfinden, das diese generischen Lernprogramme nicht schnell lernen und uns innerhalb weniger Spielinstanzen besiegen würden.
Fortschritte in der Perspektive gesehen
Sicherlich erweitern die Erfindungen der Menschheit beim Rechnen, Sortieren von E-Mails und jetzt beim Spielen die Fähigkeiten des nackten Menschen, ohne seine Werkzeuge. Dieser Fortschritt versetzt Computersysteme fest in den Bereich eines Werkzeugs. Eine Hinterhacke ist in gewisser Weise auch übermenschlich. Versuchen Sie, einen Kilometer Rohr ohne einen zu verlegen.
Umgekehrt spielt die Menschheit die Rolle des Gesundheitsdienstleisters für Computer. Wenn sie krank werden oder versagen, sind wir gezwungen, ihre Viren und Würmer auszutreiben oder ihre ausgefallenen Teile zu ersetzen. Andernfalls geraten unsere Häuser und Geschäfte in Unordnung.
Technologie sollte wie in allen Dingen in der Perspektive betrachtet werden.
Es wäre klug, wenn Menschen weniger von Spielen und gegenseitigen Schlägen fasziniert wären und sich mehr auf kollaboratives soziales Verhalten konzentrieren würden, das darauf abzielt, soziale und wirtschaftliche Probleme mit den neu erfundenen Werkzeugen zu lösen und dies auf eine Weise zu tun, die keine neuen Probleme schafft oder einlädt neue Gräueltaten.
Fußnoten
Dass das, was als allgemeine Intelligenz beschrieben wurde, beim Menschen existiert, ist aufgrund gegenteiliger Beweise umstritten. Viele würden diese Strategien und Trends als Beweis für Grenzen der menschlichen Intelligenz anführen.
quelle