FDR-Korrektur, wenn Tests korreliert sind

7

Ich habe einen Datensatz mit einer kleinen Anzahl von Stichproben und einer großen Anzahl von Variablen. Ich habe für jede Variable einen Hypothesentest (T-Test) durchgeführt und eine Reihe von p-Werten erhalten. Die Variablen sind jedoch miteinander korreliert und die FDR-Korrektur (Benjamini-Hochberg-Verfahren) geht davon aus, dass die Tests unabhängig oder positiv regressionsabhängig sind.

~~

Aus dem Artikel von BY (2001), http://projecteuclid.org/euclid.aos/1013699998 , geht hervor, dass BY beweist, dass das BH-Verfahren auch in Datensätzen gut funktioniert, in denen Variablen unabhängig oder positiv von der Regression abhängig sind . Sie erwähnten aber auch, dass es eine andere Form der Abhängigkeit geben könnte, dass das BH-Verfahren nicht sehr gut funktioniert. Von http://www.math.tau.ac.il/~yekutiel/papers/JSPI%20--%20Dani.pdf erweitert Y das BH-Verfahren auf das BY-Verfahren, um der Situation einer nicht positiven Regressionsabhängigkeit gerecht zu werden. Meine Frage ist, was ist eine positive Regressionsabhängigkeit und was ist eine nicht positive Regressionsabhängigkeit? Ein paar Beispiele wären sehr hilfreich!

WCMC
quelle
FDR übernimmt keine Unabhängigkeit; siehe meine Antworten hier und hier zum Beispiel. Es gibt mehrere speziellere Verfahren für einzelne Arten von Abhängigkeiten, obwohl Sie detaillierter angeben müssten, welche Art von Abhängigkeit Sie in Ihrem Datensatz haben.
Chris C
@ChrisC , Vielen Dank für den Hinweis. Können Sie mir erklären, was positive Regressionsabhängigkeit ist? In der Arbeit von BY (2001) ist PRDS nur eine Erweiterung oder ein Sonderfall einer positiven Regressionsabhängigkeit. Auch in diesem Artikel , math.tau.ac.il/~yekutiel/papers/JSPI%20--%20Dani.pdf , gibt es eine nicht positive Regressionsabhängigkeit. Ich habe keine Ahnung, was diese beiden Dinge sind. Kannst du helfen?
WCMC
Um Ihre Frage zu beantworten, bedeutet eine positive Korrelation zwischen zwei Zufallsvariablen, dass wenn die eine eine bestimmte Eigenschaft hat, die andere tendenziell dieselbe hat. Im Gegenteil, es besteht eine negative Korrelation, wenn zwei Zufallsvariablen dazu neigen, nicht häufiger dieselbe Eigenschaft zu teilen, als wenn sie unabhängig wären. Ich habe das Papier von BY nicht gelesen, aber ich vermute, dass die Fälle, in denen BH nicht richtig angewendet wird, sehr speziell sind, so dass BH in den meisten Fällen in Ordnung sein sollte.
Jean Paul
1
@ JeanPaul, bitte seien Sie genauer in Ihren Beschreibungen. Auf welche Immobilie beziehen Sie sich? Die Frage betraf die positive Regressionsabhängigkeit. Auch das Raten ist keine wirkliche Antwort.
Knarpie

Antworten:

5

Sie suchen nach dem Benjamini-Yekutieli-Verfahren:

Benjamini, Yoav; Yekutieli, Daniel. Die Kontrolle der Falscherkennungsrate bei mehreren Tests in Abhängigkeit. Ann. Statist. 29 (2001), no. 4, 1165–1188. doi: 10.1214 / aos / 1013699998. http://projecteuclid.org/euclid.aos/1013699998

Die Prozedur ist in R mit der method = "BY"Option in verfügbar p.adjust(). Weitere Informationen erhalten Sie ?p.adjust.

Zoë Clark
quelle