Haben alle Kugeln in der Urne die gleiche Farbe (wenn sie nicht klar zu sehen sind)?

8

Ich habe ein Problem, das sich auf Kugeln in Urnen reduziert (es geht eigentlich um Referenz und alternative Allele in Populationen).

Angenommen, ich habe eine große, gut gemischte Urne (iid draw), die zwei Farben von Kugeln enthalten kann: Aquamarin und Rotkehlchenei-Blau ( a bzw. r ). Sie haben eine enge Farbe, daher macht eine Person, die sie klassifiziert, manchmal einen Fehler bei der Identifizierung der Farbe, nachdem sie einen Ball aus einer Urne gezogen hat. Sei die Wahrscheinlichkeit eines Fehlers, wenn der Ball wirklich r ist, und wenn der Ball wirklich a ist . Angenommen, ich kenne diese Zahlen (ich denke, sie sind kleiner als 0,01, müssen aber noch überprüft werden) und habe eine Bedeutung gewählt.e aerea

In einem Experiment zieht mein Begleiter Kugeln aus der Urne und identifiziert Kugeln als Farbe r und als a ( ). Dann sagt er mir und . Ich möchte Test , dass alle Kugeln r gegen die Urne enthält zumindest eine eine Kugel die Zahl der Kugeln gezogen gegeben.r a n = r + a r a H 0 H anran=r+araH0Ha

Mein Ziel ist es, den Test auf 2 verschiedenen Ebenen durchzuführen, um die Stärke der gemeldeten Ergebnisse mit "Stern" zu bewerten. Konnte nicht bei 0,05 = 2 Sternen ablehnen, abgelehnt bei 0,05 = 3 Sternen und abgelehnt bei 0,01 = 4 Sternen.

Welchen Test kann ich für dieses Problem verwenden? (Obwohl ich dies konventionell ausgedrückt habe, würde ich mich freuen, einen Bayes-Faktor zu erhalten und darauf basierend Schwellenwerte festzulegen. Ich bin auch mit Tests zufrieden, für deren Gültigkeit eine bestimmte Anzahl von Messungen erforderlich ist - ich kann nur klassifizieren Proben, die zu klein sind als "konnte nicht ablehnen")

Beachten Sie, dass dies anders ist als das Testen eines Anteils, da diese Tests keinen Messfehler aufweisen (und nicht für den Anteil = 0 oder 1 funktionieren). Ich dachte daran, einen Anteil ungleich Null unter Verwendung eines Fudge-Faktors basierend auf der Fehlerrate und der Stichprobengröße (z. B. Testen von wobei der wahre Anteil ist, aber ich konnte nicht auftauchen mit einer gut begründeten Zahl). Ich habe auch angefangen, meinen eigenen Test abzuleiten, aber es hat eine ganze Weile gedauert und dies scheint das Problem zu sein, das jemand zuvor untersucht hätte.H 0 = P e r P.H0H0=PerP

Bearbeiten Die Frage wurde leicht umgeschrieben, um zu verdeutlichen, dass ich die Reihenfolge der Ziehungen / Klassifizierungen nicht kenne

Gleichnamig
quelle

Antworten:

2

Ich gebe zu, dass ich die andere Antwort nicht vollständig gelesen habe, aber ein grober Ansatz wäre nur zu beachten, dass einer Binomialverteilung folgt, wenn alle Kugeln Rotkehlchenei-Blau sind, sodass Sie ablehnen können, wenn ist "zu groß" basierend auf dem Binomialmodell. Wenn dies nicht geht, wäre vielleicht ein Likelihood-Ratio-Test besser, worauf Zachary Blumenfeld abzielt.( n , p = e r ) aa(n,p=er)a

dsaxton
quelle
1

Ich glaube, ich habe die Wahrscheinlichkeitsfunktion (Vollständige Offenlegung, ich bin nicht 100% sicher). Sobald Sie eine Wahrscheinlichkeit abgeleitet haben, sollte der Rest des Hypothesentests einfacher sein.

Angenommen, Sie haben eine Stichprobe der Größe mit der Bezeichnung . Nehmen wir zur Vereinfachung an:( X 1 , . . . X n )n(X1,...Xn)

iXi Xi ={ 1

Xi={1ifclassifiedascolora0ifclassifiedascolorr
Bezeichne ferner den "wahren" Farbindikator der Beobachtung als so dass; Angenommen, die Fehlerrate ist bekannt, . iXi er(0,1)
Xi={1ifobservationiscolora0ifobservationiscolorr
er(0,1)

Die von abhängige Wahrscheinlichkeit von ist dann eine Bernoulli-Verteilung; Wir können dies auch ausdrücken als; Wir kennen auch die Wahrscheinlichkeit von und dass und dann nach einiger Algebra; XiXi P(Xi|XXi P+P(

P(Xi=1|Xi,er)={1erifXi=1erifXi=0
P(Xi|Xi,er)=Xi[(1er)Xier1Xi]+(1Xi)[erXi(1er)1Xi]
Xi
P(Xi|p)=pXi(1p)1Xi
P(Xi|er,p)=P(Xi|Xi=1,er)P(Xi=1|p)+P(Xi|Xi=0,er)P(Xi=0|p)
P(Xi|er,p)=p[(1er)Xier1Xi]+(1p)[erXi(1er)1Xi]

Ihre Wahrscheinlichkeit ist also;

L(pX1,..,Xn,er)=i=1nP(Xi|er,p)
=i=1np[(1er)Xier1Xi]+(1p)[erXi(1er)1Xi]

Ihr Hypothesentest reduziert sich auf vs . Sie können dies mit einem Bayes-Faktor oder mit einem aus der Wahrscheinlichkeit abgeleiteten Standardfehler oder sogar über einen parametrischen Bootstrap tun. Wie du willst. Jetzt, da Sie die Wahrscheinlichkeit haben, sollte der Rest einfach sein.H0:p=1H1:p0

Zachary Blumenfeld
quelle
Ich sehe aber nicht . Um , brauchst du sowohl als auchP ( X i = 0 | X * i , e a ) P ( X i | . . . ) E R e aP(Xi=1|Xi,er)P(Xi=0|Xi,ea)P(Xi|...)erea
gleichnamig
Entschuldigung, ich in diesem Problem angenommen , daher muss dies geändert werden. Ich habe die Hypothese auch umgekehrt geschrieben (die Null sollte , aber das kann auch leicht geändert werden. p = 0er=eap=0
Zachary Blumenfeld