Es gibt N Spieler und M Objekte, jedes der Objekte hat einen Wert. Jeder Spieler hat eine Strategie bei der Auswahl eines Objekts. In jeder Runde, in der ein Spieler ein Objekt auswählt, können viele Spieler dasselbe Objekt auswählen. Der Wert jedes Objekts wird jedoch gleichmäßig auf jeden Spieler aufgeteilt, der es ausgewählt hat. Pro Spiel gibt es 9000 Runden (Auswahlmöglichkeiten). Unser Ziel ist es, die Werte zu maximieren, die wir am Ende des Spiels sammeln.
Frage: Wie kann ich für jedes Spiel eine Wahrscheinlichkeitsverteilungsfunktion erstellen, vorausgesetzt, ihre Entscheidungen sind Zufallsvariablen?
Aktueller Ansatz: Mein aktueller Ansatz besteht darin, die Häufigkeit zu zählen, mit der ein Spieler ein bestimmtes Objekt auswählt und durch die Gesamtzahl der Runden dividiert. Dies würde eine Wahrscheinlichkeit ergeben, dass ein Spieler dieses bestimmte Objekt wahrscheinlich auswählt.
Problem: Da jeder Spieler aggressiv spielt und versucht, so unvorhersehbar wie möglich zu sein (Rauschen), sind die Wahrscheinlichkeitsverteilungsfunktionen nach meinem derzeitigen Ansatz nicht genau (9000 Runden scheinen nicht genügend Daten zu sein). Gibt es eine bessere Möglichkeit, diese Verteilungsfunktionen zu erstellen?
Hinweis: Ich habe irgendwo gelesen, dass (Bayes-Modell und HMM) besser sind als Frequenzzählungen, aber ich bin nicht sicher, wie ich es an diese Situation anpassen soll.
Antworten:
Ich bin mir nicht sicher, ob ich richtig verstehe, was die Frage ist oder aus welchen Beobachtungen die (experimentellen) Verteilungen geschätzt werden sollen .
Das Problem einer Verteilungsschätzung hängt mehr mit der Statistik als mit der Informatik zusammen, obwohl es auch in diesem Bereich relevant sein kann.
Es gibt verschiedene Methoden, die zwei Hauptansätze verwenden:
Parametrisierte Modelle einer Wahrscheinlichkeitsverteilung, bei denen man (unter der Annahme von Vorkenntnissen) ein vordefiniertes Modell (oder eine Form oder Funktion) der Verteilung (z. B. einen Gaußschen ) mit einigen freien Parametern in Abhängigkeit von Daten (Beobachtungen) verwendet und diese Parameter (z durch Maximum Likelihood oder EM-Algorithmus oder Maximum Entropy etc ..). Auch wenn die Form der Prob-Verteilung nicht bekannt ist, kann diese Methode für Approximationen wie Gauusian Mixture Models verwendet werden . Diese Methode erzeugt glatte (und normalerweise robuste ) geschätzte Verteilungen, vorausgesetzt, die vorherige Form liegt nahe am zugrunde liegenden Prob. Verteilung.
Nicht parametrisierte Modelle, schätzen die gesamte PD (einschließlich ihrer Form) direkt aus den Daten. Methoden in dieser Kategorie sind Parzen-Fenster und Kernel-Schätzung . Diese Methode kann aus der parametrisierten Schätzung besser abgeleitet werden, vorausgesetzt, die Form des zugrunde liegenden PDF ist völlig unbekannt oder nicht trivial oder in gewissem Sinne unregelmäßig.
Alle vorherigen Methoden sind rechnerisch effizient (obwohl nicht unbedingt polynomisch). Dies ist wie die Funktionsweise des Simplex-Algorithmus, obwohl es keine Polynomzeit ist, ist es in vielen praktischen Situationen effizient.
quelle
Ich denke, Sie verwenden den falschen Ansatz. Ich schlage vor, Sie verwenden die Spieltheorie, um Ihr optimales Spiel herauszufinden.
Beginnen Sie mit dem Sonderfall vonN.= 2 ;; Jeder Spieler hatM. Entscheidungen, so haben wir eine M.× M. Auszahlungsmatrix. Die Auszahlungsmatrix ist einfach zu definieren. Die optimale Strategie ist (im Allgemeinen) eine randomisierte Strategie. Es gibt Standardmethoden zur Berechnung der optimalen Strategie unter Berücksichtigung der Auszahlungsmatrix. Dann können Sie die optimale Strategie spielen. So fürN.= 2 Das Lösen dieses Spiels ist einfach.
ZumN.> 2 Die Spieltheorie wird etwas komplizierter, aber ich denke, ähnliche Ideen stellen immer noch einen besseren Ansatz für dieses Problem dar, als zu versuchen, die Verteilung zu schätzen, die jeder Spieler in der Vergangenheit gewählt hat. Schließlich ist die Vergangenheit nicht unbedingt repräsentativ für das zukünftige Spiel. Spieler können ihre Auswahl im Laufe der Zeit ändern, sodass die Verteilung ihrer Auswahl zu Beginn des Spiels möglicherweise nicht repräsentativ für die Verteilung ihrer Auswahl zu einem späteren Zeitpunkt im Spiel ist.
quelle