Es scheint eine ziemlich einfache Frage zu sein, aber wenn ich wirklich darüber nachdenke, macht Stouffers Methode für mich keinen Sinn. Deshalb:
Nehmen Sie eine zweiseitige Hypothese an. Sie berechnen zuerst aus p- Werten. Nehmen wir also ein ziemlich einfaches Beispiel. Nehmen wir zwei p- Werte von 0,05 . Dies bedeutet, dass z 1 und z 2 beide ≈ 1,96 sind . Nach der Methode von Stouffer werden z 1 und z 2 so kombiniert, dass:
Dies -score dann wird in einem umgesetztes p erneut -Wertes, in einem erhaltenen p - Wert von 0,005 , wohingegen die p - Werte von jedem Z i einzeln um ist 0,05 .
In diesem Sinne scheint es, als ob Stouffers Test den resultierenden Wert künstlich in einen Wert ändert, der den p- Werten jedes z i unähnlich ist , was für mich keinen Sinn ergibt.
Verstehe ich diesen Test falsch oder kann mir jemand helfen zu verstehen, wie / warum er funktioniert?
R
, rechnen mitprop.test(535,1000)
usw.)Antworten:
Die höhere Gesamtstichprobengröße führt zu einer höheren Leistung und damit zu einem kleineren p-Wert (zumindest wenn die Arbeitshypothese durch die Daten gestützt wird).
Dies ist normalerweise der Hauptpunkt jeder Metaanalyse: Mehrere schwache Beweise, die eine Hypothese stützen, werden zu starken Beweisen dafür kombiniert.
quelle
Der Einfachheit halber denken Sie an einen Test der Mittel. Angenommen, unter H0 ist der Behandlungseffekt Null, so dass jeder z-Wert eine gewichtete Schätzung des Behandlungseffekts θi ist. Die Stouffer-Methode liefert einen ungewichteten Durchschnitt dieser Behandlungseffekte, sodass eine genauere Schätzung (und damit ein kleinerer p-Wert) als jeder einzelne z-Wert erhalten wird. Diese ungewichtete Schätzung des Behandlungseffekts ist verzerrt, aber eine gewichtete Stouffer-Methode ist möglich, und wenn die Gewichte proportional zu 1 / Standardfehler (θi) sind, ist die Schätzung des Behandlungseffekts unvoreingenommen. Dies ist jedoch nur dann sinnvoll, wenn die einzelnen z-Werte Maße derselben Größe sind. Ein Vorteil der Methoden von Stouffer und Fisher besteht darin, dass sie auch auf Metaanalysen angewendet werden können, bei denen verschiedene Antwortvariablen ausgewählt wurden.
quelle
quelle
Ich denke, es wäre in Ordnung, 2-tailed-Ergebnisse zu kombinieren, da dies bedeutet, dass das Ergebnis Null betragen würde (wenn es Beweise dafür gibt, dass die Behandlung die Krankheit eines Patienten verstärkt, aber auch Beweise dafür, dass sie sich verschlechtert [links] -tail] ist das Nettoergebnis kein Beweis für eine bestimmte Hypothese, da sie sich aufheben und weitere Beobachtungen erforderlich sind.
quelle