Ich habe einen Datensatz, in dem ich auf signifikante Unterschiede zwischen drei Populationen in Bezug auf etwa 50 verschiedene Variablen teste. Ich mache dies einerseits mit Kruskal-Wallis-Tests und andererseits mit Likelihood-Ratio-Tests für verschachtelte GLM-Modellanpassungen (mit und ohne Population als unabhängige Variable).
Als Ergebnis habe ich einerseits eine Liste von Kruskal-Wallis- Werten und andererseits Chi-Quadrat- Werte aus den LRT-Vergleichen.p
Ich muss eine Form der Mehrfachtestkorrektur durchführen, da es> 50 verschiedene Tests gibt, und Benjamini-Hochberg FDR scheint die vernünftigste Wahl zu sein.
Die Variablen sind jedoch wahrscheinlich nicht unabhängig, da mehrere "Clans" von ihnen korreliert sind. Die Frage ist dann: Wie kann ich feststellen, ob die zugrunde liegenden Statistiken für meine Werte die Anforderungen an die positive Abhängigkeit erfüllen, die erforderlich sind, damit das Benjamini-Hochberg-Verfahren noch an den FDR gebunden ist?
Das Benjamini-Hochberg-Yekutieli-Papier von 2001 besagt, dass die PRDS-Bedingung für die multivariate Normalverteilung und die studentisierte Verteilung gilt. Was ist mit meinen Likelihood-Ratio-Test-Chi-Quadrat-Werten für den Modellvergleich? Was ist mit den Werten, die ich für die Kruskal-Wallis-Tests habe?
Ich kann die Benjamini-Hochberg-Yekutieli-FDR-Korrektur im ungünstigsten Fall verwenden, die nichts von der Abhängigkeit voraussetzt, aber ich denke, dass sie in diesem Fall zu konservativ ist und einige relevante Signale übersieht.
quelle
PRDS ist eine ausreichende, aber nicht notwendige Bedingung für BH, um den FDR zu kontrollieren. Ich würde vorschlagen, dass Sie es verwenden und auch das Benjamini-Yekutieli-Verfahren für allgemeine Abhängigkeit verwenden. Wenn der Unterschied in der Inferenz groß ist, versuchen Sie zu demonstrieren, dass BH den FDR in Ihrem speziellen Setup mithilfe von Permutationen oder Resampling-basierten Techniken steuert, die Ihre Abhängigkeitsstruktur erhalten.
quelle