Ich führe unabhängige statistische Tests mit derselben Nullhypothese durch und möchte die Ergebnisse zu einem Wert kombinieren . Es scheint, dass es zwei "akzeptierte" Methoden gibt: die Fisher-Methode und die Stouffer-Methode .p
Meine Frage betrifft die Methode von Stouffer. Für jeden einzelnen Test ich einen z-Score . Unter einer Nullhypothese wird jede von ihnen mit einer Standardnormalverteilung verteilt, so dass die Summe einer Normalverteilung mit der Varianz folgt . Daher schlägt Stouffers Methode vor, zu berechnen , das normal mit der Einheitsvarianz verteilt werden soll, und dieses dann als gemeinsames Z-Ergebnis zu verwenden. Σ z i N Σ z i / √
Das ist vernünftig, aber hier ist ein anderer Ansatz, den ich mir ausgedacht habe und der sich für mich auch vernünftig anhört. Da jedes von aus einer Standardnormalverteilung stammt, sollte die Summe der Quadrate aus einer Chi-Quadrat-Verteilung mit Freiheitsgraden stammen. So kann man berechnen und an einem wandeln p -Wertes unter Verwendung kumulative Chi-Quadrat - Verteilungsfunktion mit N Freiheitsgraden ( p = 1-x_n (S) , wo x_n ist die CDF). S = Σ Z 2 i N S p N p = 1 - X N ( S ) X N
Nirgendwo kann ich diesen Ansatz jedoch überhaupt erwähnen. Wird es jemals benutzt? Hat es einen Namen? Was wären Vor- und Nachteile gegenüber der Stouffer-Methode? Oder ist meine Argumentation fehlerhaft?
quelle
Antworten:
Ein herausstechender Fehler ist, dass die Stouffer-Methode systematische Verschiebungen im erkennen kann. ist das, was man normalerweise erwarten würde, wenn eine Alternative durchgehend zutrifft, während die Chi-Quadrat-Methode weniger Macht zu haben scheint. Eine schnelle Simulation zeigt, dass dies der Fall ist. Die Chi-Quadrat-Methode ist weniger leistungsfähig, um eine einseitige Alternative zu erkennen. Hier sind Histogramme der p-Werte nach beiden Methoden (rot = Stouffer, blau = Chi-Quadrat) für unabhängige Iterationen mit und verschiedenen einseitigen standardisierten Effekten Bereich von none ( ). bis SD ( ).10 5 N = 10 μ μ = 0 0,6 μ = 0,6zich 105 N= 10 μ μ = 0 0,6 μ = 0,6
Das bessere Verfahren hat mehr Fläche nahe Null. Für alle positiven Werte von ist diese Prozedur die Stouffer-Prozedur.μ
R-Code
Dies schließt die (auskommentierte) Fisher-Methode zum Vergleich ein.
quelle
R
Simulation leicht modifizieren , um dies zu testen. Es ist eine gute Möglichkeit, sich mit dieser Plattform für statistische Berechnungen vertraut zu machen. :-)Eine allgemeine Möglichkeit, einen Einblick in die Teststatistik zu gewinnen, besteht darin, die (normalerweise impliziten) zugrunde liegenden Annahmen abzuleiten, die dazu führen würden, dass diese Teststatistik am leistungsfähigsten ist. Für diesen speziellen Fall haben ein Student und ich dies kürzlich getan: http://arxiv.org/abs/1111.1210v2 (eine überarbeitete Version soll in Annals of Applied Statistics erscheinen).
Um es kurz zusammenzufassen (und mit den Simulationsergebnissen in einer anderen Antwort übereinzustimmen): Die Methode von Stouffer ist am wirkungsvollsten, wenn die "wahren" zugrunde liegenden Effekte alle gleich sind. Die Summe von Z ^ 2 ist am stärksten, wenn die zugrunde liegenden Effekte normalerweise um 0 verteilt sind. Dies ist eine leichte Vereinfachung, bei der Details weggelassen werden: Weitere Informationen finden Sie in Abschnitt 2.5 des oben verlinkten Vorabdrucks von arxiv.
quelle
Geringfügig o / t: Eines der Probleme bei beiden Ansätzen ist der Leistungsverlust aufgrund der Freiheitsgrade (N für Stouffer; 2N für Fisher). Hierfür wurden bessere metaanalytische Ansätze entwickelt, die Sie möglicherweise in Betracht ziehen möchten (z. B. inverse varianzgewichtete Metaanalyse).
Wenn Sie nach Beweisen für einige alternative Tests in einer Gruppe suchen, sollten Sie sich Donohos und Jins Statistik der höheren Kritik ansehen: https://projecteuclid.org/euclid.aos/1085408492
quelle
Zur Beantwortung der Frage und für alle weiteren Leser: Wird es jemals verwendet? Gibt es ein erschöpfendes Papier von Cousins (2008) über arXiv, in dem einige alternative Ansätze aufgelistet und besprochen wurden. Der vorgeschlagene scheint nicht zu erscheinen.
quelle