Ich habe einen Datensatz mit einer kleinen Anzahl von Stichproben und einer großen Anzahl von Variablen. Ich habe für jede Variable einen Hypothesentest (T-Test) durchgeführt und eine Reihe von p-Werten erhalten. Die Variablen sind jedoch miteinander korreliert und die FDR-Korrektur (Benjamini-Hochberg-Verfahren) geht davon aus, dass die Tests unabhängig oder positiv regressionsabhängig sind.
~~
Aus dem Artikel von BY (2001), http://projecteuclid.org/euclid.aos/1013699998 , geht hervor, dass BY beweist, dass das BH-Verfahren auch in Datensätzen gut funktioniert, in denen Variablen unabhängig oder positiv von der Regression abhängig sind . Sie erwähnten aber auch, dass es eine andere Form der Abhängigkeit geben könnte, dass das BH-Verfahren nicht sehr gut funktioniert. Von http://www.math.tau.ac.il/~yekutiel/papers/JSPI%20--%20Dani.pdf erweitert Y das BH-Verfahren auf das BY-Verfahren, um der Situation einer nicht positiven Regressionsabhängigkeit gerecht zu werden. Meine Frage ist, was ist eine positive Regressionsabhängigkeit und was ist eine nicht positive Regressionsabhängigkeit? Ein paar Beispiele wären sehr hilfreich!
Antworten:
Sie suchen nach dem Benjamini-Yekutieli-Verfahren:
Benjamini, Yoav; Yekutieli, Daniel. Die Kontrolle der Falscherkennungsrate bei mehreren Tests in Abhängigkeit. Ann. Statist. 29 (2001), no. 4, 1165–1188. doi: 10.1214 / aos / 1013699998. http://projecteuclid.org/euclid.aos/1013699998
Die Prozedur ist in R mit der
method = "BY"
Option in verfügbarp.adjust()
. Weitere Informationen erhalten Sie?p.adjust
.quelle