Gibt es eine scheinbar einfache Wahrscheinlichkeitsfrage, die tatsächlich nicht zu lösen ist?

7

Gibt es gute Beispiele für ein scheinbar einfaches Wahrscheinlichkeitsproblem, das tatsächlich nicht zu lösen ist?

Ich versuche, den Einsatz von Simulationen zu motivieren, und möchte ein Beispiel dafür geben, wann es notwendig ist, dass es zugänglich ist. Die Hoffnung ist so etwas wie:

"Intuitiv scheint es einfach genug zu sein, die Anzahl der nach einer Pokerrunde verbleibenden Asse zu modellieren, aber aufgrund von , und ist eine Analyse tatsächlich nicht möglich."xyz

Aber ich kämpfe darum, ein gutes / einfaches Beispiel zu finden.

Jede Hilfe wäre dankbar.

Søren Emil Schmidt
quelle
3
Diese Frage erscheint ziemlich weit gefasst, vage und subjektiv: "Einfach" in welchem ​​Sinne? "Zugänglich" für wen? Was genau bedeutet "analytisch berechnen"? Was ist ein "gutes" Beispiel? Genau wie schwierig ist "undurchführbar"? Wenn zum Beispiel eine Annäherung an 100 Dezimalstellen existiert, aber keine theoretisch exakte geschlossene Formel existiert, wäre das "machbar" oder nicht?
whuber
3
Ich habe keine Referenz zur Hand, aber ich erinnere mich, dass Mark Kac an Monte Carlo dachte, weil er daran interessiert war, die Wahrscheinlichkeit zu ermitteln, ein Solitairespiel zu gewinnen, wenn ein bestimmter Kartensatz angezeigt wird. Die Lösung war zumindest für ihn kombinatorisch unlösbar. Ich meine diesen letzten Satz nicht in einem abfälligen Sinne. Ich weiß nur nicht, ob in den 50 Jahren seitdem jemand dieses Problem analytisch gelöst hat oder nicht.
meh
4
Danke für das Aufklären. Ich finde Ihr Kriterium immer noch "ein Student mit einigen Kenntnissen der Wahrscheinlichkeit würde intuitiv denken, dass" geschlossene Form lösbar "ist, wenn es in Wirklichkeit unlösbar ist," (hoch) subjektiv zu sein. Ihre Frage bezieht sich eher auf das Wissen, die Ausbildung und die Denkprozesse hypothetischer Studenten als auf die Wahrscheinlichkeit. Sicherlich finden Sie leicht zugängliche Wege, um die Simulation zu motivieren. Wenn Ihr Publikum beispielsweise weiß, wie man das Monopoly-Spiel spielt, fragen Sie es nach der Gewinnchance, wenn es sich an eine Strategie und seine Gegner an eine andere hält.
whuber
2
Sicherlich ist die "offensichtliche" kanonische Antwort das Berechnen P.(Z.z) wo Z.ist normal normal. Aber, wie @whuber anspielt, während es Ihre angegebenen Kriterien zu einem „t“ erfüllt , einschließlich der Tatsache , dass es beweisbar „unlösbaren“ (in einem präzisen Sinne, dieser Kommentar Raum zu klein ist zu enthalten), ist es nicht zu folgen, Simulation (im Vergleich zur numerischen Approximation) ist die Antwort. :-) Eine etwas ernstere Antwort ist die Berechnung von Partitionsfunktionen, die im Laufe der Jahre großes Forschungsinteresse an Simulationsmethoden geweckt hat.
Kardinal
1
Das Bertrand-Paradoxon scheint ein guter Kandidat zu sein; Es wird häufig als Beispiel dafür angeführt, warum Sigma-Algebren der Schlüssel zur Definition von Wahrscheinlichkeiten sind. Je nachdem, wie die Schüler die Simulation durchführen, erhalten sie unterschiedliche Ergebnisse. Es gibt keine eindeutige Antwort, es sei denn, die Bedeutung von "zufällig ausgewählt" ist angegeben.
Sycorax sagt Reinstate Monica

Antworten:

2

Die Überlebensfunktion S.tist eine Menge von Interesse für viele (die meisten?) Arten der Ereignisverlaufsanalyse. Es wird allgemein geschätzt und es werden "Überlebenskurven" dargestelltS.tversus Zeit werden oft verwendet, um die kumulative Wahrscheinlichkeit von Ereignissen zwischen verschiedenen Gruppen zu vergleichen. Statistische Vergleiche werden oft durch Inferenz erleichtert - Dinge wie Hypothesentest und Konfidenzintervalle.

Ich und einige Statistiker haben mit verschiedenen Ansätzen zu kämpfen, um einen asymptotischen analytischen Schätzer für die Stichprobenvarianz der Überlebensfunktion bereitzustellen (σS.^t2) in zeitdiskreten Ereignisverlaufsmodellen ( a la Zeitereignisverlaufsmodellen logit Hazard-, Probit Hazard- usw. Modelle), die nützlich wären, um Hypothesentests und Konfidenzintervalle zu erstellen.

Es stellt sich heraus, dass - wie ich es am besten verstehe - die asymptotische Varianz von Summen von Zufallsvariablen (wie der Stichprobenmittelwert) zwar geschätzt und üblich geschätzt werden kann , die asymptotische Varianz von Produkten von Zufallsvariablen jedoch ein schwierig zu schätzendes Problem darstellt .

S.^t=ich=1t1- -h^ich

wo h^t ist die zeitdiskrete Gefahrenfunktion zum Zeitpunkt t.

Wir haben einen asymptotischen Schätzer der Varianz dieses Welpen mehr oder weniger aufgegeben und erklärt, dass numerische Techniken wie Bootstrapping unsere besten Wetten zu sein scheinen.

Alexis
quelle
0

Sie haben 5 Variablen und führen eine "multivariate" Analyse durch. Sie gehen von einer multivariaten Normalität aus und genießen einen vollständigen Datensatz. Dann sind die Maximum-Likelihood-Schätzungen des Mittelwerts und der Kovarianzmatrix geschlossen und leicht zu berechnen .

Oh warte, du wolltest keine gemeinsame Normalität annehmen. Sie wollten davon ausgehen, dass jede Ihrer Variablen geringfügig einer Beta-Verteilung folgt. Keine große Sache. Es muss ein multivariates Analogon der Beta-Verteilung mit einer beliebigen Korrelationsstruktur geben , oder? Nun, vielleicht können Sie etwas konstruieren , aber ich werde es für meine Geduld als "unlösbar" bezeichnen. Hier ist ein reddit Post von jemandem, der versucht, etwas Ähnliches ohne viel Glück herauszufinden.

Ben Ogorek
quelle
0

Ein einfaches Wahrscheinlichkeitsproblem, das nicht zu lösen ist, könnte das folgende für ein Pferderennen sein.

Wenn der Pferdetrainer eine Gewinnrate von 25% und der Jockey eine Gewinnrate von 10% und das Pferd eine Gewinnrate von 40% hat, wie hoch ist die nicht normalisierte Erfolgswahrscheinlichkeit des Pferdes im heutigen Rennen?

Der Trainer hat das Pferd auf eine Erfolgsquote von 40% trainiert. Wird die Quote bei zukünftigen Rennen auf 25% sinken? Hat der Jockey eine bessere Chance als 15% und um wie viel auf einem Pferd, das 40% der Zeit gewinnt, und einem Trainer, der 25% der Zeit gewinnt?

Robert
quelle