Ein "State of the Art" -Modell für die Verteilung der in einem Fußballspiel erzielten Tore ist das von Dixon und Robinson (1998) "Ein Geburtsprozessmodell für Fußballspiele der Vereinigung", das zwei Schlüsselphänomene erklärt:
1) Am Ende eines Spiels werden mehr Tore erzielt als zu Beginn (vermutlich aufgrund der Müdigkeit beider Mannschaften).
2) Die Trefferquote hängt aus einer Vielzahl von Gründen von der aktuellen Ergebnislinie ab, z. B. wenn Teams mit einem Vorsprung selbstgefällig werden oder Teams lieber unentschieden spielen, als einen Verlust zu riskieren, indem sie den Sieg anstreben
Das Modell geht davon aus, dass die von den Heim- und Auswärtsteams in einem Spiel erzielten Tore inhomogenen Poisson-Prozessen folgen. Lassen bezeichnen die Zeit in einem Spiel vergangen ist , normalisiert fallen zwischen 0 und 1 , die x -length Vektor → t H bezeichnen die Zeiten , zu denen die Heimmannschaft erzielten Tore und die y -length Vektor → t A bezeichnen die Zeiten , zu denen Die Auswärtsmannschaft erzielte Tore. Die Wahrscheinlichkeit für das Spiel ist dann
Dabei ist die Trefferquote für die Heimmannschaft zum Zeitpunkt t in Abhängigkeit von einer Kombination aus zeithomogenen Faktoren (z. B. Angriffsfähigkeit der Heimmannschaft gegenüber Verteidigungsfähigkeit der Auswärtsmannschaft, Heimvorteil) und zeitinhomogenen Faktoren (z. B. Punktelinie zum Zeitpunkt t) ). Ähnliches gilt für μ ( t ) .
Die beiden Prozesse sind abhängig, da sich die Punktelinie ändert, wenn ein Team Punkte erzielt, und die Bewertungsraten selbst von der Punktelinie abhängen.
Die Wahrscheinlichkeit kann leicht bewertet werden, indem die Integration in den Exponenten numerisch durchgeführt wird. Daher ist es einfach, die Parameter des Modells (Teamfähigkeiten, Heimvorteil, Zeiteffekt, Parameter der Score-Linie usw.) über die maximale Wahrscheinlichkeit zu berechnen.
In Bezug auf die Vorhersage sind offensichtliche Größen von Interesse:
- : Heimmannschaft gewinnt
- : Auswärtsteam gewinnt
- : zeichnen
- Wahrscheinlichkeit bestimmter Bewertungslinien, z. B.
- Wahrscheinlichkeit der Gesamttore im Spiel, zB
Um diese Größen (ungefähr) bei einer Reihe von Modellparametern zu berechnen, könnten wir Monte-Carlo-Methoden verwenden, um Übereinstimmungen gemäß diesen Prozessen zu generieren und dann die Häufigkeit jeder Endpunktzahl zu berechnen. Das Simulieren aus den Prozessen ist relativ einfach, indem Ziele aus einem einzigen umhüllenden homogenen Poisson-Prozess in Verbindung mit einer Ablehnungsstichprobe generiert und dann entsprechend an das Heim- oder Auswärtsteam verteilt werden.
Der Nachteil dieses Ansatzes ist offensichtlich die Rechenlast der Monte-Carlo-Simulation. Versuchen Sie, Vorhersagen in Echtzeit zu treffen, während Spiele gespielt werden, von denen möglicherweise viele gleichzeitig stattfinden, und dies gibt schnell Anlass zur Sorge.
Meine Frage ist daher, ob es alternative Ansätze gibt, die wir in Betracht ziehen können und die keine hohen Rechenkosten verursachen (selbst wenn sie auf einer Näherung beruhen, die die Genauigkeit für eine einfache Berechnung opfert).
Aus Gründen der Klarheit suche ich nicht nach (grundlegenden) Vorschlägen zur effizienten Implementierung der Monte-Carlo-Simulation, die ich bereits in Multithread-C geschrieben habe, die Quasi-Zufallszahlen verwendet, die mithilfe des Abrollens vorgeneriert wurden, und die stückweise Ausdünnung ausnutzt eine sehr hohe Akzeptanzrate erreichen. Wenn Sie der Meinung sind, dass noch Spielraum für eine dramatische Leistungssteigerung besteht, bin ich natürlich ganz Ohr, aber ich suche wirklich einen grundlegend anderen Ansatz!
quelle