Mehrfachvergleichskorrektur für abhängige Vergleiche

7

In diesem Blog-Beitrag diskutieren die Autoren die gleichzeitige Schätzung von Quantilen und die Erstellung einer simultanen Konfidenzhüllkurve für die Schätzung, die die gesamte Quantilfunktion abdeckt. Sie tun dies, indem sie Bootstrapping durchführen und dann punktweise Bootstrap-Konfidenzintervalle berechnen und eine Bonferroni-Typkorrektur für mehrere Vergleiche anwenden. Da die Vergleiche nicht unabhängig sind, berechnen sie so etwas wie eine effektive Anzahl unabhängiger Versuche nach einer Formel

Neq=N2i,jr(bi,bj)

Dabei ist die Anzahl der zu schätzenden Punkte und die Stichprobenkorrelation zwischen dem und dem ten Bootstrap-Vektor.Nr(bi,bj)ithj

Meine Frage ist, woher diese Formel kommt. Sie bieten einen Link zu einer Quelle, aber ich sehe diese Formel nicht in der Quelle. Ist jemandem bekannt, dass diese spezielle Korrektur in der Literatur verwendet wird?

crf
quelle

Antworten:

5

Betrachten wir ein einfacheres, aber eng verwandtes Problem. Angenommen, Sie haben einen Vektor dessen Einträge eine Korrelationsmatrix . Wenn diagonal ist , dann ist die Varianz des Stichprobenmittelwertes von IS . Wenn alle gleich sind, reduziert sich dies auf das häufigere , und wir können Terme neu anordnen, um die Stichprobengröße als Funktion der beiden Varianzen zu erhalten:xRRxσx¯2=σi2/n2σi2σ2/n

n=σ2/σx¯2

Wenn jedoch nicht diagonal ist, ist die Varianz von gleich:Rx¯

σx¯2=ijσiσjrij/n2

In dem Fall, in dem , reduziert sich dies auf:σi=σj  i,j

σx¯2=σ2ijrij/n2

In Analogie zum Ausdruck für die Stichprobengröße im unkorrelierten Fall ist das Verhältnis zwischen diesem und die "effektive Stichprobengröße" :σ2ness

ness=σ2/σx¯2=σ2σ2ijrij/n2=n2ijrij

Wenn diagonal ist, dann ist , da die diagonalen Elemente von gleich und alle nicht diagonalen Elemente gleich sind und die effektive Stichprobengröße wie erwartet der tatsächlichen Stichprobengröße entspricht .Rijrij=nnR10

Der Vergleich der effektiven Stichprobengröße mit der tatsächlichen Stichprobengröße liefert eine Schätzung der Auswirkung der Korrelation ungleich Null auf Ihr Schätzproblem. Wenn Ihre Korrelationen hoch sind (entweder positiv oder negativ) oder Sie viele davon haben, können die Auswirkungen natürlich ziemlich erheblich sein.

Die Beziehung zwischen diesem Beispiel und Ihrem Fall ist wie folgt. Betrachten Sie anstelle der "Stichprobengröße" als die Anzahl der geschätzten Quantile. Die grundlegende Bonferroni-Korrektur passt Vergleiche an. Da bekannt ist, dass die Schätzungen von Quantilen korreliert sind, ist die Bonferroni-Korrektur (bei positiven Korrelationen) zu pessimistisch (selbst für Bonferroni, was im Allgemeinen zunächst ziemlich pessimistisch ist). nn

Betrachten Sie dazu eine Situation, in der Sie zehn Quantile schätzen und die Fehler in den Quantilschätzungen perfekt korrelieren. Angenommen, Sie schätzen die Quantile einer Normalverteilung mit einer bekannten Varianz von eins. Ihre Schätzungen haben alle die Form , wobei vom betreffenden Quantil abhängt. Die Fehler in Ihren Quantilschätzungen sind alle genau gleich dem Fehler in Ihrer Schätzung des Mittelwerts, sodass die Erfassung von punktweisen Konfidenzintervallen dem gleichzeitigen Konfidenzintervall entspricht. Tatsächlich haben Sie nur eine Schätzung, aber Bonferroni (ohne Korrektur) passt Ihre Konfidenzintervalle so an, als hätten Sie zehn Schätzungen, sodass sie breiter sind, als sie sein sollten. Die obige Berechnung mitx¯±kkrij=1  i,j führt wie gewünscht zu , und das Bonferroni-Intervall unter Verwendung der effektiven Stichprobengröße ist in diesem Fall korrekt.ness=1

Die Quelle befindet sich in dem Artikel (Solow-Polasky), auf den in dem von Ihnen angegebenen Link verwiesen wird. Die Formel lautet Gleichung (7), obwohl die Notation völlig anders ist.

Jbowman
quelle