Modelle von voreingenommenen Münzen haben typischerweise einen Parameter . Eine Möglichkeit, aus einer Reihe von Ziehungen abzuschätzen, besteht darin, einen Beta-Prior zu verwenden und die posteriore Verteilung mit binomialer Wahrscheinlichkeit zu berechnen.
In meinen Einstellungen ändern sich meine Münzeigenschaften aufgrund eines seltsamen physikalischen Prozesses langsam und wird eine Funktion der Zeit . Meine Daten sind eine Reihe von geordneten Zeichnungen, dh . Ich kann davon ausgehen, dass ich nur ein Unentschieden für jedes in einem diskreten und regelmäßigen Zeitraster habe.
Wie würden Sie das modellieren? Ich denke an so etwas wie einen Kalman-Filter, der an die Tatsache angepasst ist, dass die versteckte Variable und die Binomialwahrscheinlichkeit beibehält. Womit könnte ich modellieren , um die Inferenz nachvollziehbar zu halten?
Bearbeiten Sie die folgenden Antworten (danke!) : Ich möchte als Markov-Kette der Ordnung 1 modellieren , wie dies in HMM- oder Kalman-Filtern der Fall ist. Die einzige Annahme, die ich machen kann, ist, dass glatt ist. Ich könnte mit ein kleines Gaußsches Rauschen schreiben (Kalman-Filteridee), aber dies würde die Anforderung brechen, dass muss in bleiben . Nach der Idee von @J Dav könnte ich eine Probit-Funktion verwenden, um die reale Linie auf abzubilden , aber ich habe die Intuition, dass dies eine nicht analytische Lösung ergeben würde. Eine Beta-Verteilung mit Mittelwert und eine größere Varianz könnte den Trick machen.
Ich stelle diese Frage, da ich das Gefühl habe, dass dieses Problem so einfach ist, dass es zuvor untersucht worden sein muss.
quelle
Antworten:
Ich bezweifle, dass Sie ein Modell mit analytischer Lösung entwickeln können, aber die Schlussfolgerung kann mit den richtigen Werkzeugen immer noch nachvollziehbar gemacht werden, da die Abhängigkeitsstruktur Ihres Modells einfach ist. Als Forscher für maschinelles Lernen würde ich es vorziehen, das folgende Modell zu verwenden, da die Schlussfolgerung mithilfe der Technik der Erwartungsausbreitung ziemlich effizient gemacht werden kann:
Sei das Ergebnis des ten Versuchs. Definieren wir den zeitvariablen ParameterX(t) t
Um mit zu verknüpfen , führen Sie latente Variablen einη(t) X(t)
und Modell seinX(t)
Wenn Sie an der Implementierung des Inferenzalgorithmus interessiert sind, lesen Sie dieses Dokument . Sie verwenden ein sehr ähnliches Modell, sodass Sie den Algorithmus leicht anpassen können. Um EP zu verstehen, kann die folgende Seite nützlich sein. Wenn Sie an diesem Ansatz interessiert sind, lassen Sie es mich wissen. Ich kann detailliertere Ratschläge zur Implementierung des Inferenzalgorithmus geben.
quelle
Um auf meinen Kommentar einzugehen, ist ein Modell wie p (t) = exp (-t) ein Modell, das einfach ist und die Schätzung von p (t) durch Schätzung von Verwendung der Maximum-Likelihood-Schätzung ermöglicht. Aber nimmt die Wahrscheinlichkeit wirklich exponentiell ab? Dieses Modell wäre eindeutig falsch, wenn Sie Zeiträume mit hoher Erfolgshäufigkeit beobachten als früher und später. Das oszillatorische Verhalten könnte als p (t) = p | sint | modelliert werden . Beide Modelle sind sehr gut handhabbar und können mit maximaler Wahrscheinlichkeit gelöst werden, bieten jedoch sehr unterschiedliche Lösungen.0 0 0
quelle
Ihre Wahrscheinlichkeit ändert sich mit aber wie Michael sagte, wissen Sie nicht wie. linear oder nicht? Es sieht aus wie ein Modellauswahlproblem, bei dem Ihre Wahrscheinlichkeit :t p
Ein einfacher explorativer Ansatz wäre, mehrere Probits für mit unterschiedlichen nichtlinearen zu versuchen und eine -Modellauswahl basierend auf Standardinformationskriterien durchzuführen .Φ g() g()
So beantworten Sie Ihre überarbeitete Frage:
Wie Sie sagten, würde die Verwendung von probit nur numerische Lösungen implizieren, aber Sie können stattdessen eine logistische Funktion verwenden:
Logistische Funktion:P[θ(t+1)]=11+exp(θ(t)+ϵ)
Linearisiert durch:logP1−P=θ(t)+ϵ
Ich bin mir nicht sicher, wie dies unter dem Kalman-Filter-Ansatz funktionieren kann, glaube aber dennoch, dass eine nichtlineare Spezifikation wie oder viele andere ohne zufälligen Term dies tun wird mach den Job. Wie Sie sehen können, ist diese Funktion "smoth" in dem Sinne, dass sie kontinuierlich und differenzierbar ist. Leider würde das Hinzufügen von zu Sprüngen der resultierenden Wahrscheinlichkeit führen, was Sie nicht möchten. Mein Rat wäre daher, herauszunehmen .ϵ ϵθ(t+1)=at3+bt2+ct+d ϵ ϵ
Logit-Wahrscheinlichkeit:P[Coint+1=H|t]=11+exp(θ(t))
Sie haben bereits Zufälligkeiten im bernoulli-Ereignis (Markov-Kette) und fügen aufgrund von eine zusätzliche Quelle hinzu . Somit könnte Ihr Problem als Probit oder Logit gelöst werden, geschätzt durch Maximum Likelihood mit als erklärende Variable. Ich nehme an, Sie stimmen zu, dass diese Sparsamkeit sehr wichtig ist. Es sei denn, Ihr Hauptziel ist es, eine bestimmte Methode (HMM und Kalman Filter) anzuwenden und nicht die einfachste gültige Lösung für Ihr Problem zu finden.tϵ t
quelle