Angesichts des laufenden TCEC-Turniers dachte ich, wie kommen sie zu den Bewertungen dieser Computer? Vermutlich sollte eine Schach-Engine mit einer Bewertung von 2000 eine Punktzahl von etwa 0,5 gegenüber einer 2000-bewerteten Schach-Engine erwarten. Dies macht es möglicherweise einfach zu überprüfen, ob Schach-Engines wirklich ungefähr der Bewertung entsprechen, die sie angeblich abgeben. Dies ist jedoch problematisch für höher bewertete Programme wie komodo, der angeblich bei 3250 liegt. Offensichtlich spielen keine Menschen auf diesem Niveau. Darüber hinaus spielen selbst 2800 bewertete Computer nicht gegen Menschen (ich bezweifle, dass Magnus gegen Computer spielt, um Entwicklern bei der Definition ihrer Bewertung zu helfen). Es ist sogar verdächtig, wenn Motoren gegen Großmeister spielen, um ihre Stärke zu bestimmen. Ich vermute also, dass diese Motorbewertungen von Motoren bestimmt werden, die vor langer Zeit Gegner ähnlicher Stärke spielen. und die meisten Bewertungen stammen heutzutage von Engine vs Engine-Spielen. Aber wenn dies wahr wäre, würde ich nicht erwarten, dass die Motorbewertungen im Vergleich zur menschlichen Elo-Skala genau sind. Gibt es eine Möglichkeit, die Richtigkeit der Motorwerte zu überprüfen?
8
Antworten:
Die Bewertungen der Computerschachmotoren beziehen sich nicht auf die FIDE-Bewertungsliste.
Zum Beispiel hat der
MicroMax
Motor eine CCRL-Bewertung von etwa 1950:Ich verteile eine iOS-App ( ChessMini ) für diese Engine. Ich schrieb auf der App-Beschreibungsseite:
Dies gilt nur, wenn die CCRL-Schachbewertung der FIDE-Bewertungsliste sehr nahe kommt.
Leider haben sich mehrere Benutzer beschwert, dass sie die App überzeugend schlagen konnten, obwohl ihre FIDE-Bewertungen weit unter 1900 liegen. Tatsächlich habe ich selbst eine FIDE-Bewertung um 2000, aber die MicroMax-Engine hat mich nie geschlagen. Ich denke, es ist "echte" Bewertung auf der FIDE-Skala ist 1300-1400.
Vergessen Sie die menschliche Bewertungsliste, schauen Sie sich einfach die relative Rangfolge an .
Computerschachbewertungen sind außerordentlich genau (aber keine Beziehung zur FIDE), da die Stichprobengröße nur durch Ihre Verarbeitungsleistung begrenzt ist. Sie starten ein Motorturnier, lassen den Computer laufen und gehen ins Bett ... Es ist 24 Stunden Schach wie bei TCEC. Sie spielen so viele Engine-Matches, wie sich Ihr Computer leisten kann.
Computer-Engines erhalten eine Bewertung, indem sie andere Engines spielen. Keine menschliche Intervention. Kein Großmeister. Jeder mit einem Laptop kann das:
Das war's, es ist so einfach! Sie erhalten geschätzte Bewertungen für Ihre Motoren.
quelle