Warum verwendet die FIDE immer noch Elo?

11

Ich war beeindruckt von der Funktionsweise des Glicko- Bewertungssystems. Im Speziellen:

  • Bei mehr kürzlich gespielten Spielen stabilisiert sich Ihre Bewertung
  • Wenn in letzter Zeit weniger Spiele gespielt werden, schwankt Ihre Bewertung, bis Sie mehrere aktuelle Spiele erhalten

USCF hat ihr System vor einigen Jahren so geändert, dass es ähnlich ist (wo es eine gleitende Skala gibt, um die Bewertungsänderung für ein bestimmtes Spiel zu verstärken oder zu dämpfen), und jetzt, da Glickman (der Erfinder von Glicko) im Bewertungsgremium für die USCF ist, Ich kann mir vorstellen, dass sie irgendwann ein noch flexibleres System wie sein eigenes einführen werden.

Gibt es einen Grund (abgesehen davon, dass sie gegen Veränderungen resistent sind oder dass sie noch nicht dazu gekommen sind), dass die FIDE kein genaueres Bewertungssystem einführt?

Eve Freeman
quelle

Antworten:

9

Es ist nicht bewiesen, dass Glicko genauer ist. Glicko löst das Problem nur auf eine andere Art und Weise, mit einem anderen Schwerpunkt. Bedenken Sie, dass alle diese Systeme einen menschlichen Geist zu einer 4-stelligen Zahl abstrahieren.

Es gibt viel Politik in Ratings; Es ist ein heikles Thema. Wenn die FIDE es übernehmen würde, würden sie eine neue Top-100-Liste erstellen, und viele GMs wären wahrscheinlich verärgert.

Das ELO-System ist sehr einfach zu verstehen; Transparenz ist wichtig. Komplexere Systeme haben unmittelbare Nachteile.

Tony Ennis
quelle
6
+1, obwohl ich mit dem ersten Absatz nicht einverstanden bin, ist der Rest wahr genug. 1) Glicko ist im Durchschnitt nachweislich genauer (gemessen daran, wie oft es vorhersagen kann, wer ein bestimmtes Spiel gewinnt). 2) Über die Abstraktion eines menschlichen Geistes zu einer Zahl ist dies nicht wirklich der Fall. Es ist ein Maß für die Fertigkeit, sodass Sie beim Vergleich der Fertigkeitsstufen die Wahrscheinlichkeiten (für Gewinn / Unentschieden / Verlust) berechnen können. Es wird alles durch Mathematik und Statistik unterstützt. In Glicko-2 gibt es sogar einen neuen Faktor für die Volatilität für Spieler, die uneinheitlich spielen (wodurch ihre Bewertungen stärker schwanken können).
Eve Freeman
1
Interessant. Ich würde jedoch bestätigen, dass "im Durchschnitt besser" nicht unbedingt "besser" ist. Was ist, wenn die Zeiten, in denen es nicht genauer ist, tatsächlichen Schaden verursachen? Ich werde es jedoch nachlesen.
Tony Ennis
7

Soweit ich weiß, fügt das Glicko-Bewertungssystem der Bewertungsnummer eine Zuverlässigkeitsbewertung hinzu, was zu einer höheren Fairness bei der Berechnung der Bewertungsbewertung führen kann. Offensichtlich könnte dies zu der falschen Annahme führen, dass es eine Korrelation zwischen dem Spielen von bewerteten Spielen und der daraus resultierenden Spielstärke gibt (da das Nichtspielen die Zuverlässigkeitsbewertung verringert, was wiederum Ihre Bewertungszahl irgendwie herabsetzt). Ich sehe viele Probleme im Zusammenhang mit der Zuverlässigkeitsbewertung, obwohl ich zugeben muss, dass ich kein Experte für die Feinheiten des Systems bin. Nur um drei auszuwählen:

  • Ein Spieler, der nur das selten bewertete Spiel spielt, erhält möglicherweise keine Einladungen mehr. Stellen Sie sich vor, Sie sind ein Turnierdirektor, der attraktive Spieler einlädt. Jetzt müssen Sie zwischen 10 Spielern wählen, die alle die gleiche Bewertungsnummer, aber unterschiedliche Zuverlässigkeitszahlen haben. Wahrscheinlich werden Sie zuerst diejenigen mit den besten Zuverlässigkeitszahlen auswählen. Mit der Zeit könnte sich die Zuverlässigkeitslücke zwischen Spielern mit vielen und weniger bewerteten Spielen vergrößern.
  • Die Manipulation von Bewertungsnummern könnte einfacher werden. Sogar das ELO-System ist nicht betrügerisch, da einige Leute Bewertungen oder IM / GM-Normen erhalten haben, indem sie an manipulierten Turnieren teilgenommen haben. Eine gute Zuverlässigkeitsbewertung kann es sehr billig machen, Spielern ohne Zuverlässigkeitsbewertung zu helfen - der gute Spieler gibt Bewertungspunkte, ohne selbst viel zu verlieren. Sobald es um Geld geht, ist es wichtig, betrügerisch zu sein. Ich habe das Gefühl, dass das Glicko-Bewertungssystem anfälliger für Manipulationen ist.
  • Die Kommunikation und das Verständnis von Spielstärke könnten für die Massen schwieriger werden. Wenn Sie eine Rangliste übermitteln, treten Probleme auf. Ein Spieler mit einer Bewertung von 2000-50 hat irgendwo zwischen 1900 und 2100 eine "echte Spielstärke". Ein anderer Spieler hat 1950-2000, was einer Zahl im Bereich von 1750 bis 2150 entspricht. Also der Spieler mit 1950-2000 könnte tatsächlich der bessere Spieler sein, wird aber wahrscheinlich unter dem anderen platziert, nur weil er weniger Spiele gespielt hat oder gegen weniger zuverlässige Gegner. Sie erschweren es den Menschen, Ihr Ranking-System zu erklären, ohne wirklich mehr Fairness zu garantieren. Ein GM, der aufhört zu spielen, könnte "potenzielle Stärke" gewinnen und sich seines Weltmeisters Potenzial rühmen, weil seine Zuverlässigkeitszahl mehr Raum für Abweichungen schafft (beachten Sie:

Um es zusammenzufassen: Sie erhalten möglicherweise mehr, als Sie erwartet hatten, da das gesamte Paket nicht nur Verbesserungen enthält. Und da es am oberen Ende der Ranglisten schwere finanzielle Probleme gibt, sehe ich keine Vorteile einer Änderung eines bestehenden Systems.

Strahl
quelle
Die meisten Ranglisten haben einen Grenzwert für den Zuverlässigkeitswert (RD), anstatt zu versuchen, ihn zum Rangieren von Spielern zu verwenden. Ein 2000 (50) würde also immer höher eingestuft als ein 1950 (100). Entsprechend ihrer aktuellen Bewertung sind sie unabhängig von der Zuverlässigkeit höher bewertet. Wenn der Spieler von 1950 (100) gegen den Spieler von 2000 (50) gewinnen würde, würde sich seine Wertung signifikanter erhöhen als wenn er 1950 (50) wäre. Können Sie genauer beschreiben, wie man das System mit Glicko betrügen könnte? Sprechen Sie über Sandsacking Ihrer Bewertung, wenn Sie hohe RD haben?
Eve Freeman
@West Freeman: Ich bezweifle, dass dies der perfekte Ort ist, um die relative Betrugsanfälligkeit eines Bewertungssystems zu beweisen, und ich nehme nur Vermutungen an, weil es für mich billiger erscheint, das System zu manipulieren, da ich nicht so viele Bewertungspunkte verlieren werde mich selbst, wenn ich absichtlich gegen einen Spieler ohne Wertung verliere. Der wichtigere Punkt meiner Antwort ist, dass Sie ein System nicht nur auf Berechnungsgerechtigkeit, sondern auch auf Betrugsanfälligkeit, Kommunikationsfähigkeit usw. überprüfen sollten, bevor Sie ein funktionierendes System wegwerfen.
Ray
Aber wie hilft es jemandem, seine Bewertung künstlich zu erhöhen? Normalerweise versuchen Leute, die versuchen, das System zu spielen, ihre Bewertung zu senken, damit sie in niedrigeren Abschnitten spielen und den ersten Preis gewinnen können. Dies kann mit Glicko einfacher sein, wenn Sie längere Zeit nicht spielen und dann einige Spiele verlieren, die Sie hätten gewinnen sollen. Aber kombiniert mit Rating-Etagen und der Tatsache, dass dies nur ab und zu möglich ist, da die RD Zeit braucht, um wieder hochzufahren.
Eve Freeman
1
Möglicherweise benötigen Sie hohe Bewertungen, um einen Titel zu erhalten, Einladungen zu erhalten oder von Clubs bezahlt zu werden, um für sie zu spielen oder als Trainer zu arbeiten. Ich spreche hier von professionellem Schach und wo das echte Geld ist, weil Sie das Verhalten der FIDE in Frage gestellt haben.
Ray