Nehmen wir an, wir haben zwei voreingenommene Münzen C1
und C2
beide haben eine unterschiedliche Wahrscheinlichkeit, den Kopf zu drehen.
Wir werfen C1
n1
Zeiten und bekommen H1
Köpfe, C2
n2
Zeiten und bekommen H2
Köpfe. Und wir stellen fest, dass das Verhältnis der Köpfe für eine Münze höher ist als für die andere.
Mit welcher Wahrscheinlichkeit können wir sagen, dass eine Münze besser ist als die andere? (Besser bedeutet hier eine höhere tatsächliche Wahrscheinlichkeit, den Kopf zu drehen).
probability
bernoulli-distribution
Thirupathi Thangavel
quelle
quelle
Antworten:
Es ist einfach, die Wahrscheinlichkeit für diese Beobachtung zu berechnen, da die beiden Münzen gleich sind. Dies kann durch einen genauen Fishers-Test erfolgen . Angesichts dieser Beobachtungen
die Wahrscheinlichkeit , diese Zahlen zu beobachten , während die Münzen gleich die Anzahl von Versuchen gegeben sindn1 , n2 und die Gesamtmenge der Köpfe H1+H2 ist
, p(H1,H2|n1,n2,H1+H2)=(H1+H2)!(n1+n2−H1−H2)!n1!n2!H1!H2!(n1−H1)!(n2−H2)!(n1+n2)!.
Aber was Sie fragen, ist die Wahrscheinlichkeit, dass eine Münze besser ist. Da wir uns darüber streiten, wie voreingenommen die Münzen sind, müssen wir einen Bayes'schen Ansatz verwenden , um das Ergebnis zu berechnen. Bitte beachten Sie, dass in der Bayes'schen Inferenz der Begriff Glaube als Wahrscheinlichkeit modelliert wird und die beiden Begriffe austauschbar verwendet werden (s. Bayes'sche Wahrscheinlichkeit ). Wir nennen die Wahrscheinlichkeit, dass die Münzei Köpfe wirft, pi . Die posteriore Verteilung nach Beobachtung für dieses pi ist durch den Satz von Bayes gegeben :
f(pi|Hi,ni)=f(Hi|pi,ni)f(pi)f(ni,Hi)
Die Wahrscheinlichkeitsdichtefunktion (pdf)f(Hi|pi,ni) ist durch die Binomialwahrscheinlichkeit gegeben, da die einzelnen Versuche Bernoulli-Experimente sind:
Ichdavon aus, dassdas Vorwissen überbesteht, dassmit gleicher Wahrscheinlichkeitirgendwo zwischenundliegen könnte, daher. Der Nominator ist alsof(Hi|pi,ni)=(niHi)pHii(1−pi)ni−Hi f(pi)pi01f(pi)=1f(Hi|pi,ni)f(pi)=f(Hi|pi,nif(pi) pi 0 1 f(pi)=1 f(Hi|pi,ni)f(pi)=f(Hi|pi,ni) .
Um zu berechnen wir die Tatsache, dass das Integral über einem PDF eins sein muss . Der Nenner wird also ein konstanter Faktor sein, um genau das zu erreichen. Es ist ein PDF bekannt, das sich vom Nominator nur durch einen konstanten Faktor unterscheidet, nämlich die Beta-Verteilung . Daher istf(ni,Hi) ∫10f(p|Hi,ni)dp=1 f(pi|Hi,ni)=1B(Hi+1,ni−Hi+1)pHii(1−pi)ni−Hi.
Das pdf für das Wahrscheinlichkeitspaar unabhängiger Münzen istf(p1,p2|H1,n1,H2,n2)=f(p1|H1,n1)f(p2|H2,n2).
Jetzt müssen wir dies über die Fälle integrieren, in denen , um herauszufinden, wie wahrscheinlich Münze besser ist als Münze :p1>p2 1 2 P(p1>p2)=∫10∫p‘10f(p‘1,p‘2|H1,n1,H2,n2)dp‘2dp‘1=∫10B(p‘1;H2+1,n2−H2+1)B(H2+1,n2−H2+1)f(p‘1|H1,n1)dp‘1
Ich kann dieses letzte Integral nicht analytisch lösen, aber man kann es mit einem Computer numerisch lösen, nachdem man die Zahlen eingegeben hat. ist die Beta-Funktion und ist die unvollständige Beta-Funktion. Beachten Sie, dass da eine fortlaufende Variable ist und niemals genau mit identisch ist .B(⋅,⋅) B(⋅;⋅,⋅) P(p1=p2)=0 p1 p2
In Bezug auf die vorherige Annahme zu und Anmerkungen dazu: Eine gute Alternative zum Modell, von der viele glauben, ist die Verwendung einer Beta-Verteilung . Dies würde zu einer endgültigen Wahrscheinlichkeit führen: Auf diese Weise könnte man eine starke Tendenz zu regulären Münzen im Großen und Ganzen modellieren, aber gleich , . Es wäre gleichbedeutend damit, die Münze zusätzliche Male zu werfen und Köpfe zu empfangen, was gleichbedeutend wäre, nur mehr Daten zu haben. ist die Anzahl der Würfe, die wir nicht machen müsstenf(pi) Beta(ai+1,bi+1) P(p1>p2)=∫10B(p‘1;H2+1+a2,n2−H2+1+b2)B(H2+1+a2,n2−H2+1+b2)f(p‘1|H1+a1,n1+a1+b1)dp‘1. ai bi ai+bi ai ai+bi wenn wir dies vorher einschließen.
Das OP gab an, dass beide Münzen in unbekanntem Maße voreingenommen sind. Ich habe also verstanden, dass alles Wissen aus den Beobachtungen abgeleitet werden muss. Aus diesem Grund habe ich mich für einen nicht informativen Vorgänger entschieden , der das Ergebnis nicht in Richtung normaler Münzen verzerrt.
Alle Informationen können in Form von pro Münze übermittelt werden . Das Fehlen eines informativen Prior bedeutet nur, dass mehr Beobachtungen erforderlich sind, um zu entscheiden, welche Münze mit hoher Wahrscheinlichkeit besser ist.(Hi,ni)
Hier ist der Code in R, der eine Funktion Verwendung des einheitlichen Prior liefert :=P(p1>p2) f(pi)=1
P(n1, H1, n2, H2)
Sie können für verschiedene experimentelle Ergebnisse zeichnen und , z. B. mit diesem Code festlegen:P(p1>p2) n1 n2 n1=n2=4
Möglicherweise müssen Sie
install.packages("lattice")
zuerst.Man kann sehen, dass selbst mit dem einheitlichen Prior und einer kleinen Stichprobengröße die Wahrscheinlichkeit oder der Glaube, dass eine Münze besser ist, ziemlich solide werden kann, wenn sich und genug unterscheiden. Ein noch kleinerer relativer Unterschied ist erforderlich, wenn und noch größer sind. Hier ist ein Diagramm für und :H1 H2 n1 n2 n1=100 n2=200
Martijn Weterings schlug vor , die posteriore Wahrscheinlichkeitsverteilung für die Differenz zwischen und zu berechnen . Dies kann durch Integrieren des PDFs des Paares über die Menge :p1 p2 S(d)={(p1,p2)∈[0,1]2|d=|p1−p2|} f(d|H1,n1,H2,n2)=∫S(d)f(p1,p2|H1,n1,H2,n2)dγ=∫1−d0f(p,p+d|H1,n1,H2,n2)dp+∫1df(p,p−d|H1,n1,H2,n2)dp
Auch hier kann ich kein Integral analytisch lösen, aber der R-Code wäre:
Ich habe für , , und alle Werte von aufgetragen :f(d|n1,H1,n2,H2) n1=4 H1=3 n2=4 H2
Sie können die Wahrscheinlichkeit von berechnen über einem Wert von liegen . Beachten Sie, dass die doppelte Anwendung des numerischen Integrals mit einem numerischen Fehler verbunden ist. ZB sollte immer gleich da immer einen Wert zwischen und annimmt . Das Ergebnis weicht jedoch häufig geringfügig ab.|p1−p2| d 1 d 0 11 d 0 1
integrate(fd, d, 1, n1, H1, n2, H2)
integrate(fd, 0, 1, n1, H1, n2, H2)
quelle
Ich habe eine numerische Simulation mit durchgeführt
R
, wahrscheinlich suchen Sie nach einer analytischen Antwort, aber ich dachte, dies könnte interessant zu teilen sein.In diesem ersten Code simuliere ich einfach zwei Münzwürfe. Hier kann man natürlich sehen, dass es
theta1 > theta2
dann natürlich die Frequenz vonH1
höher sein wird alsH2
. Beachten Sie die verschiedenenN1
,N2
Größen.Mal sehen, was wir mit verschiedenen machen können
thetas
. Beachten Sie, dass der Code nicht optimal ist. Überhaupt.0,93 ist also die Häufigkeit (von 100), bei der die erste Münze mehr Köpfe hatte. Dies scheint in Ordnung zu sein, betrachtet
theta1
undtheta2
verwendet.Mal sehen mit zwei Vektoren von
thetas
.Denken Sie daran, dass dies
res_v
die FrequenzenH1 > H2
von 100 Simulationen sind.Wenn also
theta1
zunimmt,H1
steigt natürlich die Wahrscheinlichkeit , höher zu sein.Ich habe einige andere Simulationen gemacht und es scheint , dass die Größen
N1
,N2
sind weniger wichtig.Wenn Sie mit dem
R
Code vertraut sind , können Sie ihn mit diesem Code beleuchten. Mir ist bewusst, dass dies keine vollständige Analyse ist und verbessert werden kann.quelle
res_v
sich ständig ändert, wenn sich die Thetas treffen. Ich verstand die Frage, als sie nach nur einer einzigen Beobachtung nach der intrinsischen Tendenz der Münzen fragte. Sie scheinen zu beantworten, welche Beobachtungen man machen würde, wenn man die Voreingenommenheit kennt.