Wie können wir in einem Eröffnungsbaum auf ChessBase die Statistiken so korrigieren, dass Transpositionen bei der Gesamtzahl der Spiele nicht berücksichtigt werden?

8

In einem Eröffnungsbaum (auch "Eröffnungs-Explorer" oder "Eröffnungsbuch" genannt) auf ChessBase 12 sind hier die Statistiken, die wir nach 1. Sf3 c5 erhalten:

Es scheint also, dass Weiß nach 1. Sf3 c5 in 93% der Fälle 2. e4 spielt.
Es ist offensichtlich, dass diese Statistiken Unsinn sind.
Jeder weiß, dass Weiß nach 1. Sf3 c5 Weiß 50% der Zeit, 2. g3 30% der Zeit und 2. e4 nur 10% der Zeit spielt.
Weiße Spieler, die 1. Sf3 spielen, sind im Allgemeinen nicht sehr daran interessiert, in einen offenen Sizilianer
einzusteigen ... "2. e4 464238" bedeutet nicht "in dieser Position hat Weiß den Zug 2. e4 464238 mal gespielt", es bedeutet nur " die Position, die nach dem 2. Zug erreicht wurde. e4 wurde 464238 Mal durch verschiedene Zugreihenfolgen erreicht ".
Wie können wir dieses Problem lösen?
Es sollte physikalisch nicht unmöglich sein, da die meisten anderen Eröffnungsbäume dieses Problem nicht haben ( ChessOKs Eröffnungsbaum ,365Chess 'Eröffnungs-Explorer und FICS' Eröffnungs-Explorer haben dieses Problem nicht.

Wenn wir mit der rechten Maustaste klicken und dann auf "Eigenschaften" klicken, wird dieses Fenster geöffnet:

Leider scheint das Aktivieren oder Deaktivieren des Kontrollkästchens "Nicht gespielte Transpositionen" nichts zu bewirken.

Schicksal
quelle
1
Wenn Sie "Nicht gespielte Transpostions" deaktivieren, wird auf der Registerkarte "Eröffnungsbuch" nur verhindert, dass Bewegungen angezeigt werden, die nie in der Datenbank ausgeführt wurden, aber dennoch über die Transposition zu einer Position in der Datenbank führen.
dfan
Chess.com macht das auch, Scid macht es so, wie Sie es für richtig halten.
RemcoGerlich

Antworten:

2

Leider waren viele der statistischen Funktionen der Eröffnungsbuchfunktion in ChessBase in jeder Version, die ich besitze, unzuverlässig.

Zum Beispiel nach der Caro-Kann-Zeile 1. e4 c6 2. d4 d5 3. e5 Bf5 4. Sf3 e6 5. Be2 Sd7 6. OO h6 7. Sbd2 Ne7 8. Sb3 Dc7 9. Ld2, das Eröffnungsbuch PowerBook 2013 zeigt diese Tabelle:

Move       N     %    Av  Perf
          15  76.7  2409  2283

9...Bh7    8  56.3  2433  2494
9...g5     6  83.3  2405  2233
9...Nc8    4  62.5  2393  2335
9...a5     2  50.0  2561  2564
9...Be4    1 100.0  2414  2315

Zunächst einmal werden Sie feststellen, dass die Anzahl der Spiele in der Gesamtzahl (15) keinen Bezug zur Anzahl der Spiele in jeder angegebenen Variation hat (insgesamt 21).

Zweitens, wenn Sie eine einfache Arithmetik durchführen, können Sie herausfinden, dass der durchschnittliche Prozentsatz der weißen Gewinne tatsächlich 66,7% beträgt, nicht 76,7%, wie berichtet.

Lassen Sie uns dann die Gesamtstatistik der Gesamtposition ignorieren und eine Werbebuchung untersuchen. Schauen wir uns die 9 ... Bh7-Linie an, die laut Tabelle aus 8 Spielen abgeleitet wurde und einen weißen Gewinnanteil von 56,3% aufweist

Wenn Sie diesen Schritt machen, erhalten Sie eine neue Tabelle. Da wir uns jetzt an der neuen Position befinden, sollte die Positionsstatistik oben in der neuen Tabelle dieselbe lauten wie die aus der 9 ... Bh7-Detailzeile der übergeordneten Tabelle von der vorherigen Position, richtig?

Folgendes sagen sie tatsächlich :

Move       N     %    Av  Perf
           8  56.3  2545  2484

Nicht schlecht, oder? Die ersten beiden Statistiken stimmen überein ... aber die durchschnittlichen ELO- und Leistungs-ELO-Zahlen sind in der 1. Statistik um 100 ELO und in der 2. um 10 ELO niedriger.

Und hier ist die vollständige Tabelle für die neue Position

Move       N     %    Av  Perf
           8  56.3  2545  2484

10.a4      4  75.0  2455  2513
10.Bb4     4  62.5  2557  2537
10.Rc1     2  50.0  2650  2591

Auch hier hängt die Gesamtzahl der Spiele nicht mit der Anzahl der Spiele in jeder der Fortsetzungen zusammen. Und diesmal beträgt der weiße Gewinnprozentsatz 65%, nicht 56,3%. Und der Performance ELO der Position ist eindeutig nicht der Durchschnitt des Performance ELO der Fortsetzungen. Es sollte 2538 sein, ein Fehler von 50 ELO.

Ich habe ein fertiges Beispiel aus einem Spiel ausgewählt, das ich mir vor ein paar Minuten angesehen habe, aber jedes Spiel kann dieses Problem demonstrieren. Wenn ich versuche, einen Zug aus einer scheinbar gewinnbringenden Fortsetzung auszuwählen, stelle ich häufig fest, dass die Detaildaten der resultierenden Position die scheinbar "gewinnende" Statistik einfach nicht unterstützen. In einigen Fällen könnte man sagen, dass Weiß einen Gewinnanteil von bis zu 60% für die Fortsetzung hat, und in der nächsten Position hat keine der weiteren Fortsetzungen einen Prozentsatz von mehr als 50%. Einfach gesagt, es ist unsinnig.

Hier wird es interessant: Ich habe meine Referenzdatenbank als Datenbank für Spiele festgelegt, die mit PowerBook 2013 (PowerGames 2013) geliefert wurden. PowerBook 2013 wurde von ChessBase mit allen Spielen von PowerGames 2013 und nur diesen Spielen generiert .

Ich kann jetzt den Bereich des Referenzfensters öffnen und die Statistiken der Spiele in dieser Datenbank nachschlagen. Sie sollten mit den Statistiken im Eröffnungsbuch identisch sein, sind es aber nicht.

Tatsächlich zeigen die Referenzstatistiken für die 2. Position (nach 9 ... Bh7) Folgendes:

10.Bb4     4  62.5  
10.a4      2  50.0  
10.Rc1     2  50.0 

Hierher kommen die Gesamtstatistiken in PowerBook 2013! Die Gesamtzahl der Spiele = 8 (richtig) und die durchschnittliche Leistung = 56,25% (richtig)!

Tatsächlich scheint es in den PowerBook 2013-Fortsetzungsstatistiken zwei zusätzliche Spiele zu geben, in denen 10.a4 gespielt wurde (und die White anscheinend gewonnen hat), aber sie erscheinen überhaupt nicht in den Statistiken der Referenzdatenbank und werden nicht berücksichtigt in die PowerBook 2013 Gesamtstatistik.

Es spielt keine Rolle, ob dies ein Problem ist, das den kommerziell verkauften Büchern von ChessBase innewohnt, oder wie die ChessBase-Datenbanksoftware die Statistiken verwendet / berechnet / anzeigt. Einfach ausgedrückt, hier gibt es einen Fehler, der seit mindestens ChessBase 6.0 vorliegt und der erst spät als Version 11 (die von mir verwendete) behoben wurde. Achten Sie darauf, wenn Sie versuchen, mit einem Eröffnungsbuch eine Zeile basierend auf dem angeblichen Gewinnprozentsatz auszuwählen. Der beste Ansatz besteht darin, das Referenzfenster zu verwenden oder die Fortsetzungen für einige weitere Schritte zu überprüfen.

Persönlich verwende ich jetzt den Referenzfensterbereich für diesen Zweck und ertrage die leichte Verzögerung, die erforderlich ist, um die Statistiken für jede neue Position im Spiel zu aktualisieren. Ich verwende einen AMD Quad-Prozessor mit 2,9 GHz. Wenn Sie also etwas weniger Leistungsstarkes haben, spüren Sie möglicherweise die Prise etwas mehr.

Ich bin nicht übermäßig kritisch gegenüber der ChessBase-Software im Allgemeinen. Ich nutze viele der Funktionen sehr effektiv. Einige von ihnen haben jedoch bekannte Fehler, die Sie umgehen sollten.

Ein weiteres Beispiel: Versuchen Sie, eine Positionssuche in einer Datenbank zu verwenden. Ignorieren Sie die Ergebnisse. Dann bearbeiten die Position innerhalb der Suchfilter (hinzufügen, verschieben, löschen Stücke, was auch immer), notieren Sie sich die neue Position machen sind Sie nun für die Suche und die Suche erneut aus . Speichern Sie die resultierende Liste der Spiele. Setzen Sie nun den Suchfilter vollständig zurück (ich empfehle, die Datenbank ebenfalls zu schließen und erneut zu öffnen). Richten Sie zum Schluss die (geänderte) Suchposition erneut von Grund auf neu ein und führen Sie die Suche ein drittes Mal aus. Die Ergebnisse der Suche (2. (bearbeitete Position) und 3. (neue Position) sollten übereinstimmen. Sie tun dies häufig nicht. Ich habe viele Fälle festgestellt, in denen der neue Suchfilter viel mehr Spiele als der bearbeitete Suchfilter zurückgab. Ich habe keine Erklärung dafür, aber ich bearbeite die Position im Suchfilter nicht mehr. Ich erstelle immer eine neue Position (normalerweise durch Kopieren und Einfügen aus einem Spielfenster, das ich für diesen Zweck eingerichtet habe).

Hoffe das ist hilfreich!

Jaxter
quelle
1
Das Eröffnungsbuch befasst sich mit Positionen, nicht mit Variationen, was bei Transpositionen verwirrend sein kann. In Ihrem Caro-Kann-Beispiel trat die Position nach 9.Ld2 15 Mal auf, von denen Weiß 11,5 / 15 = 76,7% erzielte. Die Position nach 9.Ld2 Bh7 trat 8 Mal auf, aber nicht alle kamen von der Position nach 9.Ld2; Einige waren Transpositionen. Insgesamt 21 Spiele erreichten eine der fünf Positionen, die auftreten, wenn Schwarz auf 9.Ld2 reagiert.
dfan
@danf Ihre Erklärung ist sinnvoll, aber es macht nicht viel Sinn zu wissen, wie die Statistiken für die Position nach 9 Ld7 lauten, wenn alle Bewegungen von dieser Position zu einer völlig anderen Statistik führen. Tatsächlich handelt es sich um eine Umkehrung, bei der Sie nicht von hier dorthin gelangen können, bei der Sie nicht vermeiden können, Orte zu besuchen, die Sie nicht beabsichtigt haben. Ich denke, es wäre intuitiver und hilfreicher, die Durchschnittswerte von ELO und Win Rate für die Fortsetzungen anzuzeigen , anstatt die Statistiken für die Position, aus der die Fortsetzungen hervorgehen, die ohnehin von denen der Transpositionen abgelöst werden.
Jaxter
1

Sie können diese Informationen auf der Registerkarte Referenz und nicht auf der Registerkarte Eröffnungsbuch abrufen. (Natürlich stimmen die Statistiken nur dann genau überein, wenn Ihr Eröffnungsbuch aus Ihrer Referenzdatenbank erstellt wurde.)

dfan
quelle
1

Wir kennen das genaue Format für Chessbase-Bücher nicht und es ist durchaus möglich, dass das, was ich sagen werde, in diesem Fall nicht stimmt.

Die mir bekannten offenen Standardbuchformate (Crafty, Pro Deo, Polyglot) repräsentieren Schachpositionen als 64-Bit-Zobrist-Hash. Sie können googeln, wie eine dieser Funktionen funktioniert, wenn Sie möchten. Dies geht über den Rahmen dieser Antwort hinaus. Dies gilt wahrscheinlich auch für Chessbase-Bücher.

Diese Hashes sind so konzipiert, dass der Schlüssel für 1. e4 c5 2. Sf3 mit dem Schlüssel für 1. Sf3 c5 2. e4 identisch ist . Dies ist nützlich, um Transpositionen wie diese abzudecken. Dies bedeutet jedoch, dass es nicht zwischen Zeilen unterscheiden kann, was dazu führt, dass diese Transpositionen nicht entfernt werden können.

TL; DR Ich vermute, dass dies aufgrund technischer Einschränkungen im Chessbase-Buchformat unmöglich ist.

ZirkoniumX
quelle
0

Sie können auch einen Eröffnungsschlüssel für die Spiele erstellen und nach Ihren Wünschen anordnen. Wenn Sie einen Knoten in der Taste markieren und 'S' drücken, können Sie die Statistiken anzeigen.

Ein Passant
quelle
Leider untersuchen wir Linien, in denen jeder Zug Zweige hat. Das Erstellen eines solchen Schlüssels müsste automatisch erfolgen. Die Referenzfunktion erledigt dies bereits im laufenden Betrieb. Der Unterschied besteht darin, dass der Schlüssel statisch / permanent ist, der Referenzbericht jedoch dynamisch / temporär. Sie können die Knoten des Schlüssels also mehrmals verwenden und die Einrichtungskosten einmal bezahlen. Wenn Sie eine Position mehr als einmal in der Referenz verwenden, müssen Sie alle Berechnungen jedes Mal wiederholen . Ich kenne keine automatisierte Methode zum Erstellen solcher Schlüssel, aber die Funktion "Eröffnungsbuch" macht das Gleiche. Aber seine Statistiken sind falsch ...
Jaxter
0

Eine Lösung, die ich für dieses Problem entwickelt habe, besteht darin, dass Sie zum ersten Knoten gehen können. Jetzt nimmst du die Spieleliste und trennst sie. Dann verwenden Sie einen Baum, um zum zweiten Knoten zu gelangen. Am Ende erhalten Sie eine Liste der Spiele mit der genauen Zugreihenfolge, an der Sie interessiert sind.

Ich weiß, dass es umständlich ist und dass eine automatische Lösung großartig wäre (wie ein Schalter, den Sie in den Baum drehen könnten, um es so oder so zu haben), aber ich dachte nur, ich würde dies als Möglichkeit rauswerfen, wenn es nur ein paar Zeilen sind, die Sie brauchen genaue Umzugsaufträge für.

hpcp
quelle