Ein veröffentlichter Artikel ( pdf ) enthält diese 2 Sätze:
Darüber hinaus kann eine fehlerhafte Berichterstattung durch die Anwendung falscher Regeln oder mangelnde Kenntnis des statistischen Tests verursacht werden. Beispielsweise kann die Gesamt-df in einer ANOVA als der Fehler df in der Berichterstattung eines Tests angesehen werden, oder der Forscher kann den berichteten p-Wert eines ≤ 2 oder F- Tests durch zwei dividieren , um eine Eins zu erhalten -seitiger p- Wert, wohingegen der p- Wert eines χ 2- oder F- Tests bereits ein einseitiger Test ist.
Warum könnten sie das gesagt haben? Der Chi-Quadrat-Test ist ein zweiseitiger Test. (Ich habe einen der Autoren gefragt, aber keine Antwort erhalten.)
Übersehen ich etwas?
hypothesis-testing
chi-squared
Joel W.
quelle
quelle
Antworten:
Der Chi-Quadrat-Test ist grundsätzlich immer ein einseitiger Test . Hier ist ein lockerer Weg, darüber nachzudenken: Der Chi-Quadrat-Test ist im Grunde genommen ein Test der Anpassungsgüte. Manchmal wird es ausdrücklich als solches bezeichnet, aber selbst wenn dies nicht der Fall ist, ist es im Wesentlichen immer noch oft eine gute Passform. Zum Beispiel ist der Chi-Quadrat-Test der Unabhängigkeit auf einer 2 × 2-Häufigkeitstabelle (eine Art) ein Test der Anpassungsgüte der ersten Zeile (Spalte) an die durch die zweite Zeile (Spalte) festgelegte Verteilung und umgekehrt , gleichzeitig. Wenn sich der realisierte Chi-Quadrat-Wert also am rechten Ende seiner Verteilung befindet, deutet dies auf eine schlechte Anpassung hin, und wenn er relativ zu einem vorgegebenen Schwellenwert weit genug ist, können wir den Schluss ziehen, dass er so schlecht ist, dass Wir glauben nicht, dass die Daten von dieser Referenzverteilung stammen.
Wenn wir den Chi-Quadrat-Test als zweiseitigen Test verwenden würden, wären wir auch besorgt, wenn die Statistik zu weit links von der Chi-Quadrat-Verteilung liegt. Dies würde bedeuten, dass wir befürchten, die Passform könnte zu gut sein . Dies ist einfach nichts, worüber wir uns normalerweise Sorgen machen. (Als historische Randnotiz bezieht sich dies auf die Kontroverse darüber, ob Mendel seine Daten verfälscht hat. Die Idee war, dass seine Daten zu gut waren, um wahr zu sein. Weitere Informationen finden Sie hier, wenn Sie neugierig sind.)
quelle
Das hängt wirklich von zwei Dingen ab:
Das heißt, wir müssen sehr vorsichtig sein, was wir mit dem "Chi-Quadrat-Test" abdecken wollen, und genau sagen, was wir mit "einseitig" oder "zweiseitig" meinen.
Unter bestimmten Umständen (zwei, die ich erwähnt habe; es können weitere sein) kann es durchaus sinnvoll sein, es zweiseitig zu bezeichnen, oder es kann sinnvoll sein, es zweiseitig zu bezeichnen, wenn Sie eine gewisse Lockerheit bei der Verwendung der Terminologie akzeptieren.
Es mag vernünftig sein zu sagen, dass es immer nur einseitig ist, wenn Sie die Diskussion auf bestimmte Arten von Chi-Quadrat-Tests beschränken.
quelle
quelle
Diese Ablesung würde verwirren, wie die Teststatistik erzeugt wurde, mit der die Endpunkte der Teststatistik betrachtet werden.
quelle
Ich hatte auch einige Probleme, mich mit dieser Frage auseinanderzusetzen, aber nach einigem Experimentieren schien es, als ob mein Problem einfach darin bestand, wie die Tests benannt sind.
In SPSS als Beispiel kann eine 2x2-Tabelle einen Chisquare-Test enthalten. Es gibt zwei Spalten für p-Werte, eine für "Pearson Chi-Sqare", "Continuity Correction" usw. und ein weiteres Spaltenpaar für den genauen Fisher-Test, wobei eine Spalte für einen zweiseitigen Test und eine weitere Spalte für einen zweiseitigen Test vorhanden ist 1-seitiger Test.
Ich dachte zuerst, die 1- und 2-Seiten bezeichnen eine 1- oder 2-seitige Version des chisquare-Tests, was seltsam erscheint. Es stellte sich jedoch heraus, dass dies die zugrunde liegende Formulierung der alternativen Hypothese im Test eines Unterschieds zwischen Anteilen, dh des Z-Tests, bezeichnet. Der oft vernünftige zweiseitige Test der Proportionen wird in SPSS mit dem chisquare-Test erreicht, bei dem das chisquare-Maß mit einem Wert im (einseitigen) oberen Ende der Verteilung verglichen wird. Vermutlich haben andere Antworten auf die ursprüngliche Frage bereits darauf hingewiesen, aber ich habe einige Zeit gebraucht, um genau das zu realisieren.
Die gleiche Formulierung wird übrigens auch in openepi.com und möglicherweise in anderen Systemen verwendet.
quelle
quelle
quelle