Ich überprüfe ein Papier, das> 15 separate 2x2 Chi Square-Tests durchgeführt hat. Ich habe vorgeschlagen, dass sie für mehrere Vergleiche korrigieren müssen, aber sie haben geantwortet, dass alle Vergleiche geplant wurden, und daher ist dies nicht erforderlich.
Ich bin der Meinung, dass dies nicht korrekt sein muss, aber keine Ressourcen finden kann, die explizit angeben, ob dies der Fall ist.
Kann mir jemand dabei helfen?
Aktualisieren:
Vielen Dank für all Ihre sehr hilfreichen Antworten. Auf die Anfrage von @ gung nach weiteren Informationen zur Studie und zu den Analysen hin werden Zählungsdaten für zwei Arten von Teilnehmern (Studenten, Nicht-Studenten) unter zwei Bedingungen über drei Zeiträume hinweg verglichen. Die mehreren 2x2-Chi-Quadrat-Tests vergleichen für jeden Teilnehmertyp jede Zeitperiode und jede Bedingung (sofern dies sinnvoll ist, z. B. Schüler, Bedingung 1, Zeitperiode 1 und Zeitperiode 2), sodass alle Analysen dieselbe Hypothese prüfen .
Antworten:
Dies ist meiner Meinung nach ein komplexes Problem, und ich möchte drei Kommentare zu dieser Situation abgeben.
Zunächst und allgemein würde ich mich mehr darauf konzentrieren, ob Sie einer konfirmatorischen Studie mit einer Reihe wohlgeformter Hypothesen gegenüberstehen, die in einem argumentativen Kontext definiert sind, oder einer erklärenden Studie, in der viele wahrscheinliche Indikatoren beobachtet werden, als ob sie geplant sind oder nicht (weil Sie dies können) einfach vorhaben, alle möglichen Vergleiche anzustellen).
Zweitens würde ich mich auch darauf konzentrieren, wie die resultierenden p-Werte dann diskutiert werden. Werden sie einzeln verwendet, um eine Reihe endgültiger Schlussfolgerungen zu liefern, oder werden sie gemeinsam als Beweise und Mangel an Beweisen diskutiert?
Abschließend möchte ich die Möglichkeit diskutieren, dass die> 15-Hypothese, die sich aus den> 15 separaten Chi-Quadrat-Tests ergibt, tatsächlich den Ausdruck einiger Hypothesen (möglicherweise einer einzigen) darstellt, die zusammengefasst werden können.
Ganz allgemein, unabhängig davon, ob Hypothesen vorgegeben sind oder nicht, hängt die Korrektur von Mehrfachvergleichen davon ab, was Sie in den Typ-I-Fehler einschließen. Wenn Sie MC nicht korrigieren, behalten Sie nur eine Fehlerratensteuerung nach Vergleichstyp I bei. Im Falle zahlreicher Vergleiche haben Sie eine hohe familienbezogene Typ-I-Fehlerrate und sind daher anfälliger für falsche Entdeckungen.
quelle
In Anbetracht Ihrer Aktualisierung des Designs würde ich vorschlagen, dass sie eine Art log-lineares Modell ausführen, um alle Daten auf einmal zu verwenden. Die Stück-Mahlzeit-Analysen, die sie durchgeführt haben, scheinen (a) ineffizient (b) unwissenschaftlich zu sein, da sie 15 Hypothesen prüfen, bei denen es sicherlich weniger echte Hypothesen gibt.
Ich bin kein Fan von Korrekturen für Multiplizität als bedingtem Reflex, aber in diesem Fall würde ich vorschlagen, dass sie korrigieren, wenn sie einen tieferen analytischen Ansatz ablehnen.
quelle
Wenn Sie das Wort "vorsätzlich" durch "geplant" ersetzen, kann dies dazu beitragen, das Argument der Autoren zu zerstreuen. Betrachten Sie zwei verschiedene statistische Analysen derselben Daten:
So oder so, es ist "Mord" - die Frage ist, ob es im ersten Grad oder im zweiten Grad ist. Offensichtlich ist der erste moralisch problematischer. Es klingt für mich, als wollten die Autoren hier behaupten, es sei kein Mord, weil er vorsätzlich war.
quelle
In diesem Artikel wird Ihre Frage direkt beantwortet: http://jrp.icaap.org/index.php/jrp/article/view/514/417
(Frane, AV, "Geplante Hypothesentests sind nicht unbedingt von der Multiplizitätsanpassung ausgenommen", Journal of Research Practice, 2015)
quelle