Bayes-Schätzer sind immun gegen Selektionsverzerrungen

11

Sind Bayes-Schätzer immun gegen Selektionsverzerrungen?

Die meisten Veröffentlichungen, in denen die Schätzung in hoher Dimension erörtert wird, z. B. Daten zur gesamten Genomsequenz, werfen häufig das Problem der Selektionsverzerrung auf. Die Auswahlverzerrung ergibt sich aus der Tatsache, dass, obwohl wir Tausende potenzieller Prädiktoren haben, nur wenige ausgewählt werden und auf die ausgewählten wenigen geschlossen wird. Der Prozess läuft also in zwei Schritten ab: (1) Auswählen einer Teilmenge von Prädiktoren (2) Durchführen einer Inferenz auf die ausgewählten Mengen, z. B. Schätzen von Quotenverhältnissen. Dawid konzentrierte sich in seinem Paradoxonpapier von 1994 auf unvoreingenommene Schätzer und Bayes-Schätzer. Er vereinfacht das Problem bei der Auswahl des größten Effekts, der ein Behandlungseffekt sein könnte. Dann, sagt er, sind unvoreingenommene Schätzer von Selektionsverzerrungen betroffen. Er benutzte das Beispiel: Nimm

ZiN(δi,1),i=1,,N
dann ist jedesZi fürunverzerrtδi . Sei Z=(Z1,Z2,,ZN)T , der Schätzer
γ1(Z)=max{Z1,Z2,,ZN}
ist jedoch für max { δ 1 , (positiv) vorgespannt.max{δ1,δ2,,δN} . Diese Aussage kann leicht mit Jensens Ungleichung bewiesen werden. Wenn wir also imax , den Index des größten δi , werden wir nur Zimax als Schätzer verwenden, der unvoreingenommen ist. Aber weil wir das nicht wissen, verwenden wir stattdessen γ1(Z) das (positiv) voreingenommen wird.

Geben Sie hier die Bildbeschreibung ein

Die besorgniserregende Aussage von Dawid, Efron und anderen Autoren ist jedoch, dass Bayes-Schätzer immun gegen Selektionsverzerrungen sind. Wenn ich nun vor setze , sagen wir δ ig ( . ) , Dann ist der Bayes-Schätzer von δ i durch E { δ iZ i } gegebenδiδig(.)δi wobeim(zi)=φ(zi-δi)g(δi)dδi

E{δiZi}=zi+ddzim(zi)
m(zi)=φ(ziδi)g(δi)dδi mit φ(.) der Standard-Gaußsche ist.

Wenn wir den neuen Schätzer von als γ 2 ( Z ) = max { E { δ 1Z 1 } definieren , E { δ 2Z 2 } , , E { δ NZ N } } , was auch immer i Sie wählen, um δ i max mit γ 1 ( Z zu schätzenδimax

γ2(Z)=max{E{δ1Z1},E{δ2Z2},,E{δNZN}},
iδimaxγ1(Z) , wird die gleiche sein , wenn die Auswahl basierte auf i basiert. Dies folgt, weil γ 2 ( Z ) in Z i monoton ist. Wir wissen auch, dass E { δ iZ i } Z i mit dem Term d gegen Nullschrumpftγ2(Z)γ2(Z)ZiE{δiZi}Zi, wodurch ein Teil der positiven Vorspannung inZiverringert wird. Aber wie können wir daraus schließen, dass Bayes-Schätzer immun gegen Selektionsverzerrungen sind? Ich verstehe es wirklich nicht.ddzim(zi)Zi
Chamberlain Foncha
quelle
1
Wenn Sie eine Behauptung in einem Stück Literatur referenzieren, können Sie bitte eine vollständige Situation und einen Seitenverweis angeben, damit wir den vollständigen Kontext dieser Behauptung lesen können.
Stellen Sie Monica am
Ist die Definition eines Schätzers als Maximum der Bayes-Schätzer immer noch ein Bayes-Schätzer?
Xi'an
Beispiel 1 im Papier.
Chamberlain Foncha

Antworten:

4

Wie oben beschrieben, besteht das Problem darin, auf den Index und den Wert (i⁰, μ⁰) des größten Mittelwerts einer Stichprobe normaler rvs zu schließen. Was mich in Dawids Präsentation überrascht, ist, dass die Bayes'sche Analyse nicht so viel Bayes'sch klingt. Wenn die gesamte Stichprobe gegeben ist, sollte ein Bayes'scher Ansatz eine posteriore Verteilung auf (i⁰, μ⁰) erzeugen, anstatt Schätzschritten von der Schätzung von i⁰ bis zur Schätzung des zugehörigen Mittelwerts zu folgen. Und falls erforderlich, sollten Schätzer aus der Definition einer bestimmten Verlustfunktion stammen. Wenn stattdessen der größte Punkt in der Stichprobe und nur dieser Punkt seine Verteilung ändert, ärgert mich die Aussage, dass keine Anpassung erforderlich ist, ziemlich.

Die vorherige Modellierung ist auch insofern ziemlich überraschend, als die Prioritäten auf den Mitteln eher gemeinsam als ein Produkt unabhängiger Normalen sein sollten, da diese Mittel verglichen und daher vergleichbar sind. Zum Beispiel scheint ein hierarchischer Prior angemessener zu sein, wobei Ort und Maßstab aus den gesamten Daten geschätzt werden müssen. Herstellen einer Verbindung zwischen den Mitteln ... Ein relevanter Einwand gegen die Verwendung unabhängiger unzulässiger Prioritäten ist, dass der maximale Mittelwert μ⁰ dann kein genau definiertes Maß hat. Ich denke jedoch nicht, dass eine Kritik an einigen Prioren gegenüber anderen ein relevanter Angriff auf dieses "Paradoxon" ist.

Xi'an
quelle
1
Mir scheint, dass der gesamte erforderliche Schutz im Prior codiert werden sollte, der alle unbekannten Mittel verbindet. Wenn der Prior große Unterschiede zwischen den Mitteln sehr unwahrscheinlich macht, wird sich dies im hinteren Bereich widerspiegeln, was ihn perfekt macht.
Frank Harrell
(i,μ)
δiN(a,1)ZiN(δi,1)δiZiδiE(δi|Zi)Zi0ZiE(δi0|Zi0)ZiE(δi0|Zi0)Zi0i0
E[δi|Zi]δiiμi's makes them dependent actually.
Xi'an
And any prior is acceptable from a Bayesian viewpoint, for instance a uniform distribution on the index and a hierarchical prior on the μi's.
Xi'an
1

Even if a bit counter-intuitive the statement is correct. Assume i=5 for this experiment, then the posterior for μ5 is really N(x5,σ2). This counter-intuitive fact is a bit similar to Bayes being immune to (secret) early stopping (that is also very counter-intuitive).

The Bayesian reasoning would lead to false conclusions if for each such experiment (imagine your repeat it a few times), only the results for the best variety would be kept. There would be data selection and Bayesian methods are clearly not immune to (secret) data selection. Actually no statistical method is immune to data selection.

If such a selection was done, a complete Bayesian reasoning taking this selection into account would easily correct the illusion.

However the sentence "Bayes estimator are immune to selection Bias" is a bit dangerous. It is easy to imagine situations where "selection" means something else, like for example selection of explanatory variables, or selection of data. Bayes is not clearly immune to this.

Benoit Sanchez
quelle