Das Elo-Bewertungssystem verwendet einen Gradientenabstiegsminimierungsalgorithmus der Kreuzentropieverlustfunktion zwischen der erwarteten und der beobachteten Wahrscheinlichkeit eines Ergebnisses in gepaarten Vergleichen. Wir können die allgemeinen Verlustfunktionen als schreiben
wobei die Summe über alle Ergebnisse und alle Gegner . ist die beobachtete Frequenz des Ereignisses und die erwartete Frequenz.
Bei nur zwei möglichen Ergebnissen (gewinnen oder verlieren) und einem Gegner haben wir
Wenn die Rangfolge des Spielers und die Rangfolge des Spielers , können wir die erwartete Wahrscheinlichkeit als Dann wird die Aktualisierungsregel für den Gradientenabstieg verwendet
Dabei sind und die erwartete und beobachtete Gewinnwahrscheinlichkeit des Spielers gegen den Spieler . Dies sind die Aktualisierungsregeln.two outcomes
Bei Vorhandensein von Ziehungen können wir das obige Modell einschließlich und des dritten Ergebnisses mit Wahrscheinlichkeit verallgemeinern
Und wir können die Verlustfunktion als erstellen
wobei ist jeweils die beobachteten Wahrscheinlichkeit , und und erwartete Wahrscheinlichkeit , und . Im letzteren Fall wäre die Aktualisierungsregelwin
loose
draw
win
loose
draw
wobei und die erwartete Wahrscheinlichkeit sind, dass der Spieler gewinnt und gegen den Spieler zieht . Und wobei und die beobachtete Wahrscheinlichkeit sind, dass der Spieler gewinnt und gegen den Spieler zieht . Dies ist die Aktualisierungsregel.three outcome
Die Frage ist, warum das Elo-Bewertungssystem die two outcomes
Aktualisierungsregeln auch bei Unentschieden verwendet.
quelle