Gute Frage.
In erster Linie hatte Deepmind in Go keine übermenschlichen Gegner, die er herausfordern konnte. Go-Motoren waren nicht annähernd das höchste Niveau der besten menschlichen Spieler. Im Schach sind die Motoren jedoch 500 ELO-Punkte stärker als die besten menschlichen Spieler. Das ist ein massiver Unterschied. Die Menge an Arbeit, die in zeitgenössische Schach-Engines gesteckt wurde, ist atemberaubend. Wir sprechen über Millionen von Stunden in der Programmierung, Hunderttausende von Iterationen. Es ist eine riesige Menge an Wissen und Arbeit. All das in 4 Stunden zu überwinden und zu übertreffen, ist atemberaubend.
Zweitens ist es nicht so sehr das Ergebnis selbst, das die Schachmeister überrascht, sondern vielmehr, wie AlphaZero Schach spielt. Es ist ziemlich ironisch, dass ein System, das kein menschliches Wissen oder Know-how hatte, am besten spielt wie wir. Motoren sind dafür berüchtigt, hässlich aussehende Moves zu spielen, solche, denen es an Harmonie mangelt usw. Es ist schwer, sie einem Nicht-Schachspieler zu erklären, aber es gibt so etwas wie einen "künstlichen Move", wie ihn die modernen Engines oft finden. AlphaZero spielt überhaupt nicht so. Es hat einen sehr menschenähnlichen Stil, in dem es die gegnerischen Figuren mit tiefem strategischem Spiel und atemberaubenden Positionsopfern dominiert. AlphaZero spielt so, wie wir es uns wünschen, und kombiniert tiefes Positionsverständnis mit der Präzision einer Motorenberechnung.
Bearbeiten
Oh und ich habe vergessen, etwas über das Ergebnis selbst zu erwähnen. Wenn Sie mit Computerschach nicht vertraut sind, mag es nicht erstaunlich erscheinen, aber es ist.
Heutzutage sind die Gewinnspannen, die die modernen Top-Motoren trennen, hauchdünn. In einem Match mit 100 Spielen können Sie ein Ergebnis wie 85 Unentschieden, 9 Siege und 6 Niederlagen erwarten, um die bessere Engine zu ermitteln.
AlphaZero 28 Siege und 72 Unentschieden ohne Verluste waren jenseitig vernichtend und bis zu dem Moment, als es passierte, völlig undenkbar.
MCTS für Schach war in der Literatur mit wenig Erfolg ausprobiert worden. Es wurde angenommen, dass AlphaGos Ansatz niemals beim Schach funktionieren würde , vielleicht in Go, aber nicht im Schach. Plötzlich gab Google bekannt, dass der Ansatz funktioniert und das stärkste Schachprogramm der Welt deutlich übertrifft.
Vor Google wurde allen Schachprogrammierern beigebracht, dass das Erstellen von Heuristiken in der Motorprogrammierung eine bessere Strategie als maschinelles Lernen ist. Unabhängig davon, wie Sie neuronale Netze implementiert haben, wäre es niemals schneller gelaufen als eine Reihe von 64-Bit-Bitboard-Anweisungen. AlphaGo lief ziemlich langsam , spielte aber das stärkste Schach.
quelle
Ich sehe, basierend auf den Artikeln, die Sie zur Verfügung stellen, viele Überraschungsstufen beim Sieg:
Schach ist schwer zu meistern und das Gegenstück hatte die besten Praktiken der Welt, AlphaZero hatte tabula rasa.
Das Lernen dauerte vier Stunden und AlphaZero verlor kein Match von 100.
Der Spielstil war eine fremde Mischung aus menschlichen und computerähnlichen Bewegungen, aggressiv und manchmal albern mit Opfern, die keine Ahnung haben, aber den zukünftigen Status tatsächlich stärken.
Die Anzahl der pro Zug berücksichtigten Möglichkeiten war geringer als das Gegenstück. AlphaZero hatte ein mysteriöses Bauchgefühl oder eine mysteriöse Intuition.
Das verärgerte Gefühl kam von der Menge an Trainingsmaterial, mit der AlphaZero sich selbst gebaut hatte, und dem Zeitlimit, das der traditionellen Maschine möglicherweise nicht genügend Zeit ließ.
quelle