Welche Verteilung nimmt der genaue Test von Fisher an?

10

In meiner Arbeit habe ich mehrere Verwendungen des exakten Fisher-Tests gesehen und mich gefragt, wie gut er zu meinen Daten passt. Bei Betrachtung mehrerer Quellen verstand ich die Berechnung der Statistik, sah jedoch nie eine klare und formale Erklärung der angenommenen Nullhypothese.

Kann mir bitte jemand eine formelle Erklärung der angenommenen Verteilung erklären oder verweisen? Wird für eine Erklärung in Bezug auf die Werte in der Kontingenztabelle dankbar sein.

Amit Lavon
quelle
3
Im 2x2-Fall basiert es auf der hypergeometrischen Verteilung.
Glen_b -State Monica

Antworten:

10

2×2X1Bin(n1,θ1)X2Bin(n2,θ2)θ1=θ2X1X1+X2ψ=θ11θ1θ21θ2ψ=1

Diese Distribution hat ihre Wikipedia-Seite .

Um es mit R zu bewerten, können Sie einfach die Formel verwenden, die die bedingte Wahrscheinlichkeit definiert:

p1 <- 7/27
p2 <- 14/70
x1 <- 7; n1 <- 27
x2 <- 14; n2 <- 56
# 
m <- x1+x2
dbinom(x1, n1, p1)*dbinom(x2, n2, p2)/sum(dbinom(0:m, n1, p1)*dbinom(m-(0:m), n2, p2))
[1] 0.1818838

Oder nutzen Sie die dnoncenhypergeomFunktion des MCMCpackPakets:

psi <- p1/(1-p1)/(p2/(1-p2)) # this is the odds ratio
MCMCpack::dnoncenhypergeom(x=x1, n1, n2, x1+x2, psi)
[1] 0.1818838
Stéphane Laurent
quelle
Vielen Dank, dass Sie @Stephane. Können Sie weiter erklären, warum es hypergeometrisch wird und welche Parameter es gibt?
Amit Lavon
2
Sorry @AmitLavon, ich kenne die Details zu dieser hypergeometrischen Verteilung nicht.
Stéphane Laurent
1
@AmitLavon Ich habe gerade meine Antwort so bearbeitet, dass sie den Link zu Wikipedia und den R-Code enthält.
Stéphane Laurent
10

χ2

  • Die beiden Variablen, die auf Assoziation untersucht werden, sind wirklich polytome Alles-oder-Nichts-Variablen wie tote / lebendige USA / Europa. Wenn eine oder beide Variablen eine Vereinfachung eines zugrunde liegenden Kontinuums darstellen, sollte eine kategoriale Datenanalyse überhaupt nicht durchgeführt werden.
  • YXYY=yXxYX2×2Der Kontingenztabellentest geht davon aus, dass jedes Subjekt, das mit Behandlung A behandelt wird, die gleiche Todeswahrscheinlichkeit hat. [Man könnte argumentieren, dass dies eine zu strenge Annahme ist, aber diese Position erkennt den Machtverlust durch nicht angepasste Assoziationstests nicht an.]

χ2XYYPPχ2 P

Frank Harrell
quelle
Vielen Dank, dass Sie @FrankHarrell. Können Sie Referenzen für Ihre Behauptung angeben, dass Chi-Quadrat-P-Werte genauer sind als die von Fisher?
Amit Lavon
1
Siehe zum Beispiel citeulike.org/user/harrelfe/tag/fishers-exact-test . Dies wurde ausführlich über den Stapelaustausch diskutiert.
Frank Harrell
Leider ist ctiteulike weg und web.archive.org scheint nur die erste Seite des Harrelfe-Kontos gecrawlt zu haben.
Glen_b -State Monica