Wie lautet die Formel für den Benjamini-Hochberg-bereinigten p-Wert?

14

Ich verstehe das Verfahren und was es steuert. Wie lautet also die Formel für den angepassten p-Wert in der BH-Prozedur für Mehrfachvergleiche?


In diesem Moment wurde mir klar, dass das ursprüngliche BH keine angepassten p-Werte produziert, sondern nur die (nicht-) Ablehnungsbedingung angepasst hat: https://www.jstor.org/stable/2346101 . Gordon Smyth hat 2002 ohnehin angepasste BH p-Werte eingeführt, so dass die Frage immer noch zutrifft. Es ist in R wie p.adjustmit der Methode implementiert BH.

Firebug
quelle

Antworten:

6

Das berühmte Seminar von Benjamini & Hochberg (1995) beschrieb die Vorgehensweise zum Akzeptieren / Ablehnen von Hypothesen basierend auf der Anpassung der Alpha-Level. Dieses Verfahren weist eine einfache äquivalente Neuformulierung in Bezug auf angepasste p Werte auf, wurde jedoch in der ursprünglichen Veröffentlichung nicht erörtert. Gordon Smyth zufolge führte er bei der Implementierung in R im Jahr 2002 angepasste p Werte ein p.adjust. Leider gibt es keine entsprechenden Zitate. Daher war mir immer unklar, was man zitieren sollte, wenn man BH-angepasste p Werte verwendet.

Es stellte sich heraus, dass das Verfahren in Benjamini, Heller, Yekutieli (2009) beschrieben ist :

pp

p(i)BH=min{minji{mp(j)j},1}.

Diese Formel sieht komplizierter aus als sie wirklich ist. Es sagt:

  1. Ordnen Sie zunächst alle Werte von klein nach groß an. Dann multipliziere jeden Wert mit der Gesamtzahl der Tests und dividiere durch seine Rangfolge.ppm
  2. Stellen Sie zweitens sicher, dass die resultierende Sequenz nicht abnimmt: Wenn sie jemals abnimmt, machen Sie den vorhergehenden Wert gleich dem folgenden (wiederholt, bis die gesamte Sequenz nicht abnimmt).p
  3. Wenn ein Wert größer als 1 ist, muss er gleich 1 sein.p

Dies ist eine einfache Neuformulierung des ursprünglichen BH-Verfahrens aus dem Jahr 1995. Es gibt möglicherweise eine frühere Veröffentlichung, in der das Konzept der BH-bereinigten Werte explizit vorgestellt wurde, mir sind jedoch keine bekannt.p


Aktualisieren. @Zenit stellte fest, dass Yekutieli & Benjamini (1999) bereits 1999 dasselbe beschrieben haben:

Bildbeschreibung hier eingeben

Amöbe sagt Reinstate Monica
quelle
Das ist die Antwort, die ich erwartet hatte: +1. Ich erinnere mich, dass ich auch über Gordon Smyths Implementierung des angepassten p- Wertes gelesen habe und nicht wusste, wen ich zitieren sollte.
Firebug
1
Ich glaube, es gibt noch eine frühere Referenz: Yekutieli und Benjamini (1999) (pdf-Version hier verfügbar ). Definition 2.4 beschreibt, wie das ursprüngliche 1995er FDR-Verfahren in angepassten p-Werten umformuliert werden kann. Gutschrift für diesen Blog-Beitrag, in dem ich darüber gefunden habe.
Zenit
@Zenit Oh wow! Toller Fund! Ich sollte meine Antwort aktualisieren.
Amöbe sagt Reinstate Monica
Danke für die Quelle @Zenit! Es ist ein bisschen seltsam, dass solch eine allgegenwärtige statistische Methode keine bekannte Referenz hat.
Firebug
7

Zuerst eine Antwort auf den Punkt. Es sei angenommen, dass der (einzelne Test) p- Wert ist, der dem Wert z 0 der Teststatistik zugeordnet ist. Der Benjamini-Hochberg-FDR wird in zwei Schritten berechnet ( N 0 = # pWerte p 0 , N = # pWerte):p0pz0N0 p0N

  • FDR (p0)=p0N0N

  • FDR (pi)=min(FDR(pi),FDR(pi+1))


Jetzt lasst uns das verstehen. Die (Bayes'sche) Grundidee ist, dass Beobachtungen aus einer Mischung von zwei Verteilungen stammen:

  • Beobachtungen aus der Nulldichte f 0 ( z )π0Nf0(z)
  • Beobachtungen aus der alternativen Dichte f 1 ( z ) .(1π0)Nf1(z)

Was beobachtet wird, ist die Mischung dieser beiden:

  • f(z)=π0f0(z)+(1π0)f1(z)

enter image description here

Die (Bayes'schen) Definitionen sind:

  • (ein Bruchteil der Schwanzflächen)Fdr=π0(1F0(z0))(1F(z))
  • fdr=π0f0(z0)f(z)

π01

enter image description here

(Basierend auf Efron & Tibshiranis Computer Age Statistical Inference )

Aditya
quelle