Ich gehe davon aus, dass "100% Überleben" bedeutet, dass Ihre Websites nur einen einzigen Organismus enthielten. 30 bedeutet also, dass 30 Organismen gestorben sind, und 31 bedeutet, dass 31 Organismen nicht gestorben sind. Basierend darauf sollte das Chi-Quadrat in Ordnung sein, aber es wird nur sagen, welche Hypothese von den Daten nicht unterstützt wird - es wird Ihnen nicht sagen, ob zwei vernünftige Hypothesen besser sind oder nicht. Ich präsentiere eine Wahrscheinlichkeitsanalyse, die diese Informationen extrahiert - sie stimmt mit dem Chi-Quadrat-Test überein, bietet Ihnen jedoch mehr Informationen als der Chi-Quadrat-Test und eine bessere Möglichkeit, die Ergebnisse darzustellen.
Das Modell ist ein Bernouli-Modell für den Indikator "Tod", ( bezeichnet die Zelle der Tabelle und bezeichnet die einzelne Einheit innerhalb die Zelle).i 2 × 3 jY.i j∼ B i n ( 1 , θi j)ich2 × 3j
Dem Chi-Quadrat-Test liegen zwei globale Annahmen zugrunde:
- Innerhalb einer gegebenen Zelle der Tabelle sind die alle gleich, θ i j = θ i k = θ iθi jθi j= θich k= θich
- die sind statistisch unabhängig, wenn . Dies bedeutet, dass die Wahrscheinlichkeitsparameter alles über - alle anderen Informationen sind irrelevant, wenn Sie θ i Y i j θ iY.i jθichY.i jθich
Bezeichne als die Summe von (also ) und sei die Gruppengröße (also ). Jetzt müssen wir eine Hypothese testen: Y i j X 1 = 30 , X 2 = 10 , X 3 = 1 N i N 1 = 61 , N 2 = 30 , N 3 = 11X.ichY.i jX.1= 30 , X.2= 10 , X.3= 1N.ichN.1= 61 , N.2= 30 , N.3= 11
H.EIN: θ1= θ2, θ1= θ3, θ2= θ3
Aber was sind die Alternativen? Ich würde sagen, die anderen möglichen Kombinationen von gleich oder ungleich.
H B 2 : θ 1 & ne; θ 2 , & thgr; 1 = θ 3 , θ 2 & ne; θ 3 H B 3 : θ 1 = θ 2 , θ 1 ≠ θ 3 , θ 2 ≠
H.B 1: θ1≠ θ2, θ1≠ θ3, θ2= θ3
H.B 2: θ1≠ θ2, θ1= θ3, θ2≠ θ3
H C : θ 1 ≠ θ 2 , θ 1 ≠ θ 3 , θ 2 ≠ θ 3H.B 3: θ1= θ2, θ1≠ θ3, θ2≠ θ3
H.C.: θ1≠ θ2, θ1≠ θ3, θ2≠ θ3
Eine dieser Hypothesen muss angesichts der oben genannten "globalen" Annahmen zutreffen. Beachten Sie jedoch, dass keiner dieser Werte bestimmte Werte für die Raten angibt - daher müssen sie heraus integriert werden. Tatsache, dass wahr ist, haben wir nur einen Parameter (weil alle gleich sind), und der einheitliche Prior ist eine konservative Wahl. Bezeichnen Sie dies und die globalen Annahmen mit . also haben wir: I 0H.EINich0
=
P.( X.1, X.2, X.3| N.1, N.2, N.3, H.EIN, I0) = ∫10P.( X.1, X.2, X.3, θ | N.1, N.2, N.3, H.EIN, I0) dθ
= ( N 1= ( N.1X.1) ( N.2X.2) ( N.3X.3) ∫10θX.1+ X.2+ X.3( 1 - θ )N.1+ N.2+ N.3- X.1- X.2- X.3dθ
= ( N.1X.1) ( N.2X.2) ( N.3X.3)( N.1+ N.2+ N.3+ 1 ) ( N.1+ N.2+ N.3X.1+ X.2+ X.3)
Welches ist eine hypergeometrische Verteilung geteilt durch eine Konstante. In ähnlicher Weise haben wir für :
P ( X 1 , X 2 , X 3 | N 1 , N 2 , N 3 , H B 1 , I 0 ) = ∫ 1 0 P ( X 1 , X 2 , X 3 , θ 1 θ 2 | N 1 , N 2 , N 3 , H B.H.B 1
P.( X.1, X.2, X.3| N.1, N.2, N.3, H.B 1, I0) = ∫10P.( X.1, X.2, X.3, θ1θ2| N.1, N.2, N.3, H.B 1,ich0) dθ1dθ2
= ( N.2X.2) ( N.3X.3)( N.1+ 1 ) ( N.2+ N.3+ 1 ) ( N.2+ N.3X.2+ X.3)
Sie können das Muster für die anderen sehen. Wir können die Chancen für berechnen, indem wir einfach die beiden obigen Ausdrücke teilen. Die Antwort ist ungefähr , was bedeutet, dass die Daten über um ungefähr den Faktor - ziemlich schwache Beweise für gleiche Raten. Die anderen Wahrscheinlichkeiten sind unten angegeben.H.EINv sH.B 14H.EINH.B 14
H.yp o t h e s i s( H.EIN| D)( H.B 1| D)( H.B 2| D)( H.B 3| D)( H.C.| D)p r o b ein b i l i t y0,0189822650,0047906690,0516200220,4841558740,440451171
Dies zeigt starke Beweise gegen gleiche Raten, aber keine starken Beweise für eine defintie Alternative. Es scheint starke Beweise dafür zu geben, dass sich die "Offshore" -Rate von den beiden anderen Raten unterscheidet, aber nicht schlüssige Beweise dafür, ob sich "Inshore" - und "Mid-Channel" -Raten unterscheiden. Dies ist, was der Chi-Quadrat-Test Ihnen nicht sagt - er sagt Ihnen nur, dass Hypothese "Mist" ist, aber nicht, welche Alternative an seine Stelle gesetzt werden sollEIN
Ich glaube, Sie könnten die "gleichzeitigen Konfidenzintervalle" für mehrere Vergleiche verwenden. Die Referenz ist Agresti et al. 2008 Gleichzeitige Konfidenzintervalle zum Vergleich von Binomialparametern. Biometrics 64 1270-1275.
Den entsprechenden R-Code finden Sie unter http://www.stat.ufl.edu/~aa/cda/software.html
quelle