Ich vergleiche zwei Gruppen von Mutanten, von denen jede nur einen von 21 verschiedenen Phänotypen haben kann. Ich würde gerne sehen, ob die Verteilung dieser Ergebnisse auf zwei Gruppen ähnlich ist. Ich habe einen Online-Test gefunden , der den "Chi-Quadrat-Test für Verteilungsgleichheit" berechnet und mir einige plausible Ergebnisse liefert. Ich habe jedoch einige Nullen in dieser Tabelle. Kann ich in diesem Fall überhaupt Chi-Quadrat verwenden?
Hier ist die Tabelle mit zwei Gruppen und Zählungen bestimmter Phänotypen:
2 1
2 3
1 6
1 4
13 77
7 27
0 1
0 4
0 2
2 7
2 3
1 5
1 9
2 6
0 3
3 0
1 3
0 3
1 0
1 2
0 1
Antworten:
Heutzutage ist es durchaus machbar, Fischers "exakten" Test an einem solchen Tisch durchzuführen . Ich habe gerade p = 0,087 mit Stata erhalten (die
tabi 2 1 \ 2 3 \ .... , exact
Ausführung dauerte 0,19 Sekunden).BEARBEITEN nach dem Kommentar von chl unten (versucht, als Kommentar hinzuzufügen, kann aber nicht formatiert werden):
Es funktioniert in R 2.12.0 für mich, obwohl ich die Option 'Arbeitsbereich' über den Standardwert von 200000 erhöhen musste:
(Die Ausführungszeit ist etwas schneller als in Stata, aber das ist von zweifelhafter Relevanz angesichts der Zeit, die benötigt wird, um die Bedeutung der Fehlermeldung zu ermitteln, bei der "Arbeitsbereich" verwendet wird, um etwas anderes als die übliche Bedeutung von R zu bedeuten, obwohl Fisher.test ist Teil des Kernstatistikpakets von R.)
quelle
Die üblichen Richtlinien sind, dass die erwartete Anzahl größer als 5 sein sollte, aber es kann etwas gelockert werden, wie im folgenden Artikel beschrieben:
Siehe auch Ian Campbells Homepage .
Beachten Sie, dass es in R immer die Möglichkeit gibt, den Wert mit einem Monte-Carlo-Ansatz ( ) zu berechnen , anstatt sich auf die asymptotische Verteilung zu verlassen.p
chisq.test(..., sim=TRUE)
In Ihrem Fall scheinen etwa 80% der erwarteten Zahlen unter 5 und 40% unter 1 zu liegen. Wäre es sinnvoll, einige der beobachteten Phänotypen zu aggregieren?
quelle