Wie kann man die Leistung eines Spielers in einem Spiel automatisch bewerten?

8

Angenommen, ich habe ein abgeschlossenes Spiel. Ich habe keine Elo-Bewertungen der Spieler. Mein Ziel ist es, die Leistung eines Spielers im Spiel ausschließlich anhand seiner Züge zu bewerten. Kann dies automatisch mit einem Schachprogramm erfolgen?

Das Ergebnis kann seine ungefähre Elo-Bewertung sein oder nur ein Wert, der seine Stärke oder Fehlerrate angibt.

Wenn es hilft, kann eine Datenbank der Spiele des Spielers angegeben werden. Wieder ohne Elo-Bewertungen.

Meine Motivation ist einfach. Ich spiele Schach über das Internet und möchte meinen Fortschritt automatisch anhand der Spiele selbst verfolgen, nicht anhand der Bewertung auf den Websites. Ich bin ein (oberer) Anfänger.

Eine einfache Lösung besteht darin, das Spiel mit einer beliebigen Computer-Engine und einer Track-Nummer von?!,? Zu kommentieren. und ?? Markierungen. Es ist jedoch nicht sehr genau und ich würde gerne mehr Ideen bekommen :)

Dennis Golomazov
quelle
Jede Bewertung, die auf einem einzelnen Spiel basiert, ist mit einer großen Fehlerquote verbunden. Ihr "Fortschritt" wird ständig auf und ab gehen und ich bezweifle, dass Sie mit dieser Methode alles andere als einen sehr langfristigen "Fortschritt" verfolgen können (was im Grunde genommen ein Durchschnitt über Spiele ist). Schachbewertungen (oder Bewertungen in fast jeder anderen Sportart) vermeiden dieses Problem, und ich sehe nichts falsches daran, die Online-Bewertung als Indikator für Ihre Stärke zu verwenden.
user1583209

Antworten:

16

Die Site-Bewertungen bei langsamen Zeitkontrollen können für Server, auf denen sich starke Spieler versammeln (ICC, FICS, um nur einige zu nennen), sehr zuverlässig sein, da die Bewertungen Ihre wahre Spielstärke SEHR genau widerspiegeln, wenn Sie genug Spiele gespielt haben. Bei sehr standardisierten Bewertungssystemen wie USCF und FIDE / ELO werden Sie feststellen, dass die verschiedenen Bewertungsklassen tendenziell auf die Arten von Fehlern hinweisen, die diese Spieler immer noch machen. NM Dan Heismans Improving Chess Thinker leistet hervorragende Arbeit bei der Erörterung der Arten von Fehlern, die Spieler in den Bewertungsklassen machen.

Haben Sie die vielen Selbsttestbücher da draußen ausprobiert? Igor Khmelnitskys Schachbewertungsprüfung und Danny Kopecs Test, Bewertung und Verbesserung Ihres Schachs sind hervorragende Bücher, mit denen Sie Ihren Fortschritt verfolgen können, indem Sie sehen, wie Sie sich gegen benotete Testpositionen behaupten.

Ihr Ansatz, meine Bewegungen mit einem Motor zu vergleichen, ist ein anderer Weg, dies zu tun, aber noch einmal, das ?? /? Bewegungen zeigen wirklich nur taktische Fehler an, nicht strategische oder positionelle oder sogar Verhaltens- oder Zeitmanagementfehler, die Sie möglicherweise machen.

Aus diesem Grund ist es ein effizienter Weg, sich zu verbessern, wenn Sie OTB- / Online-Spiele mit langsamer Zeitkontrolle gegen gleich starke Gegner spielen und sie von stärkeren Spielern überprüfen und kritisieren lassen. Ihre Fehler in jeder Kategorie (Taktik, Wissen, Denkprozess, Zeitmanagement usw.) werden hervorgehoben und Sie können den Fortschritt einfach anhand der Fehler messen, die Sie nicht mehr machen.

Eine unterhaltsame Variante, die Sie zu Hause mit einem Motor ausprobieren können: Erweitern Sie Ihre Motorbewertungsmethode, um die Qualität / Leistung eines Spielers über Bewertungsdiagramme visuell zu beobachten. Mit anderen Worten, nehmen Sie die Motorbewertungsergebnisse pro Zug und zeichnen Sie sie (einige freie Software wie SCID erledigt dies für Sie) über die Züge.

Zum Beispiel: Zwei Anfänger hätten ein Spiel, das so aussieht:

Geben Sie hier die Bildbeschreibung ein

Beachten Sie, wie gezackt diese sind. Beide Seiten machen viele schreckliche Fehler (Steigungen der Stacheln!) Und auch, wie oft sie die schrecklichen Fehler der anderen Person nicht ausnutzen.

Die Spikes machen immer Spaß: Geben Sie hier die Bildbeschreibung ein

Zwei fortgeschrittene Spieler (USCF 1400-1600) haben möglicherweise Spiele, die wie folgt aussehen: Geben Sie hier die Bildbeschreibung ein

Es sieht zwar gezackt aus, aber beachten Sie, dass die y-Achse (Motorbewertung) viel kleiner ist ... was darauf hinweist, dass diese Spieler erfahrener sind und Schach von höherer Qualität spielen als die Anfänger.

Für einen endgültigen Vergleich würde ein Grandmaster-Spiel von 1911 folgendermaßen aussehen:

Geben Sie hier die Bildbeschreibung ein

Hier sind keine Kommentare nötig :) Diese Jungs machen wirklich nicht viele Fehler, oder?

Wenn Sie Ihre eigene Heuristik für die Zuordnung der Steigungen + Skala eines Bewertungsdiagramms zu den Fähigkeiten / Leistungen der Spieler entwickeln könnten , ist dies möglicherweise ein Weg? :) :)

Shivsky
quelle
2
Beachten Sie, dass ich eine Einschränkung einwerfen möchte, dass die Motorbewertungsergebnisse in einigen nuancierten Positionen nicht so zuverlässig sind und einige materialhungrige Aromen eine Gambit-Öffnung ganz anders betrachten als ein Mensch. Wie lange Sie Ihren Motor während des Spiels auf eine halbe Zugposition stellen, beeinflusst auch die Dinge ein wenig. Sei gewarnt! :)
Shivsky
Mit welchem ​​Programm generieren Sie diese Grafik? Ich habe scid + stockfish, habe ich diese Option?
Uri
6

Für einen sehr genauen Rang der Qualität eines Spielers können Sie das hervorragende Tool von www.chess-db.com verwenden. Sie können Ihre Spiele hochladen und nach einigen Minuten die Qualität beider Spieler in Prozent im Vergleich zu den besten Zügen einer starken Engine ausgeben.

Auf dieser Seite können Sie eine PGN-Datei hochladen: http://chess-db.com/public/game_upload.jsp

Dies ist ein Beispiel für die Ergebnisse: http://chess-db.com/public/game.jsp?id=Pablo%20Bento.Shredder%20Android.107755008

user1657
quelle
2

Was Sie fragen, existiert meines Wissens nicht. Dies ist jedoch meine Idee:

Sie benötigen Samples mit den folgenden Funktionen: (1) Schachposition, (2) Zug in der Position, (3) Bewertung des Spielers, der den Zug ausgeführt hat.

Angenommen, Sie haben 1 Milliarde Proben. Sie können einen Computeralgorithmus für diese Stichproben trainieren, der für jede Bewegung in einer Position die Qualität der Bewegung in Bezug auf eine Bewertung vorhersagen kann. Alle Bewertungen für alle Züge können gemittelt werden, um die ungefähre Bewertung des Spielers und damit die Qualität seines Spiels zu erhalten.

Dies ist eine grobe Idee, die weiter poliert werden kann.

Rafiek
quelle
Das funktioniert nicht wirklich. In den meisten Spielen befinden Sie sich relativ schnell an Positionen, die nicht in der Datenbank enthalten sind - ja, selbst wenn Sie irgendwie Zugriff auf eine Milliarden-Spieledatenbank erhalten. Und du wirst bestraft, wenn dein Gegner schwach spielt - nach 1.e4 e5 2.Dh5 wird es, egal was Schwarz spielt, eine niedrige Durchschnittsbewertung haben, da diese Eröffnung viel mehr auf niedrigeren als auf höheren Ebenen gespielt wird. (Heck, sogar 1 ... e5 selbst hat wahrscheinlich eine eher niedrige Durchschnittsbewertung.) Was nach den bekannten Eröffnungen passiert, zeigt viel mehr die Stärke eines Spielers an, als wie lange er der Theorie folgt.
DM
Ich habe diese Antwort 5 Jahre vor AlphaZero gegeben. Jetzt können wir alle AlphaZero bitten, unsere Spiele für uns zu kommentieren und uns zu sagen, wie gut wir sind. Wir sind wahrscheinlich fast an dem Punkt angelangt, an dem wir sogar fragen können, WARUM ein Schritt gut oder schlecht ist. Das ist es, was Sie wirklich verbessern müssen. Aktuelle menschliche Bewertungen werden überschätzt.
Rafiek
2

chess.com CAPS. Vergleichen Sie die CAPS-Punktzahl von chess.com (Abonnement erforderlich) mit der Tabelle in einer Grafik: https://www.chess.com/article/view/better-than-ratings-chess-com-s-new-caps -System . Ebenfalls von Interesse: https://www.chess.com/article/view/who-was-the-best-world-chess-champion-in-history

Hinweis zur Vorsicht: Die Caps-Scores für ein bestimmtes Spiel sind volatil. Am besten machen Sie einen Durchschnitt der CAPS-Ergebnisse über eine Reihe von Spielen. Meines Wissens kann CAPS derzeit eine Elo-Bewertung aus einer Reihe von Zügen vorhersagen. Noch ein Hinweis: CAPS-Scores existieren in einem Vakuum ohne Rücksicht auf die Zeitsteuerung. Ich spiele besseres Schach bei langsameren Zeitkontrollen als in einem 1-minütigen Bullet-Spiel. CAPS wird diesen Unterschied in der Spielstärke erkennen und den Bullet-Spielen dementsprechend eine niedrigere Bewertung zuweisen. Dies bedeutet nicht, dass ich nicht dieselbe Person bin, die die langsameren Zeitkontrollspiele gespielt hat!

JWILD
quelle
0

Hier einige Ideen, welche Parameter gemessen werden sollen. Anzahl der Fehler pro Spiel. Wie oft haben Sie nach 10 Zügen, 15 Zügen, 20 Zügen eine gleiche oder bessere Position. Wie oft gelingt es Ihnen, die Fehler Ihres Gegners zu verwenden? Wie oft Sie objektiv gezogene Endspiele ziehen oder gewinnen. Wie oft gelingt es Ihnen, erzwungene Paarungskombinationen zu finden? Wie oft verteidigst du objektiv verlorene Endspiele erfolgreich? Wie oft verlierst du pünktlich?

Rauan Sagit
quelle