Gibt es gute Beispiele für ein scheinbar einfaches Wahrscheinlichkeitsproblem, das tatsächlich nicht zu lösen ist?
Ich versuche, den Einsatz von Simulationen zu motivieren, und möchte ein Beispiel dafür geben, wann es notwendig ist, dass es zugänglich ist. Die Hoffnung ist so etwas wie:
"Intuitiv scheint es einfach genug zu sein, die Anzahl der nach einer Pokerrunde verbleibenden Asse zu modellieren, aber aufgrund von , und ist eine Analyse tatsächlich nicht möglich."
Aber ich kämpfe darum, ein gutes / einfaches Beispiel zu finden.
Jede Hilfe wäre dankbar.
probability
simulation
probabilistic-programming
Søren Emil Schmidt
quelle
quelle
Antworten:
Die ÜberlebensfunktionS.t ist eine Menge von Interesse für viele (die meisten?) Arten der Ereignisverlaufsanalyse. Es wird allgemein geschätzt und es werden "Überlebenskurven" dargestelltS.t versus Zeit werden oft verwendet, um die kumulative Wahrscheinlichkeit von Ereignissen zwischen verschiedenen Gruppen zu vergleichen. Statistische Vergleiche werden oft durch Inferenz erleichtert - Dinge wie Hypothesentest und Konfidenzintervalle.
Ich und einige Statistiker haben mit verschiedenen Ansätzen zu kämpfen, um einen asymptotischen analytischen Schätzer für die Stichprobenvarianz der Überlebensfunktion bereitzustellen (σ2S.^t ) in zeitdiskreten Ereignisverlaufsmodellen ( a la Zeitereignisverlaufsmodellen logit Hazard-, Probit Hazard- usw. Modelle), die nützlich wären, um Hypothesentests und Konfidenzintervalle zu erstellen.
Es stellt sich heraus, dass - wie ich es am besten verstehe - die asymptotische Varianz von Summen von Zufallsvariablen (wie der Stichprobenmittelwert) zwar geschätzt und üblich geschätzt werden kann , die asymptotische Varianz von Produkten von Zufallsvariablen jedoch ein schwierig zu schätzendes Problem darstellt .
woh^t ist die zeitdiskrete Gefahrenfunktion zum Zeitpunkt t .
Wir haben einen asymptotischen Schätzer der Varianz dieses Welpen mehr oder weniger aufgegeben und erklärt, dass numerische Techniken wie Bootstrapping unsere besten Wetten zu sein scheinen.
quelle
Sie haben 5 Variablen und führen eine "multivariate" Analyse durch. Sie gehen von einer multivariaten Normalität aus und genießen einen vollständigen Datensatz. Dann sind die Maximum-Likelihood-Schätzungen des Mittelwerts und der Kovarianzmatrix geschlossen und leicht zu berechnen .
Oh warte, du wolltest keine gemeinsame Normalität annehmen. Sie wollten davon ausgehen, dass jede Ihrer Variablen geringfügig einer Beta-Verteilung folgt. Keine große Sache. Es muss ein multivariates Analogon der Beta-Verteilung mit einer beliebigen Korrelationsstruktur geben , oder? Nun, vielleicht können Sie etwas konstruieren , aber ich werde es für meine Geduld als "unlösbar" bezeichnen. Hier ist ein reddit Post von jemandem, der versucht, etwas Ähnliches ohne viel Glück herauszufinden.
quelle
Ein einfaches Wahrscheinlichkeitsproblem, das nicht zu lösen ist, könnte das folgende für ein Pferderennen sein.
Wenn der Pferdetrainer eine Gewinnrate von 25% und der Jockey eine Gewinnrate von 10% und das Pferd eine Gewinnrate von 40% hat, wie hoch ist die nicht normalisierte Erfolgswahrscheinlichkeit des Pferdes im heutigen Rennen?
Der Trainer hat das Pferd auf eine Erfolgsquote von 40% trainiert. Wird die Quote bei zukünftigen Rennen auf 25% sinken? Hat der Jockey eine bessere Chance als 15% und um wie viel auf einem Pferd, das 40% der Zeit gewinnt, und einem Trainer, der 25% der Zeit gewinnt?
quelle