Sind Bayes-Schätzer immun gegen Selektionsverzerrungen?
Die meisten Veröffentlichungen, in denen die Schätzung in hoher Dimension erörtert wird, z. B. Daten zur gesamten Genomsequenz, werfen häufig das Problem der Selektionsverzerrung auf. Die Auswahlverzerrung ergibt sich aus der Tatsache, dass, obwohl wir Tausende potenzieller Prädiktoren haben, nur wenige ausgewählt werden und auf die ausgewählten wenigen geschlossen wird. Der Prozess läuft also in zwei Schritten ab: (1) Auswählen einer Teilmenge von Prädiktoren (2) Durchführen einer Inferenz auf die ausgewählten Mengen, z. B. Schätzen von Quotenverhältnissen. Dawid konzentrierte sich in seinem Paradoxonpapier von 1994 auf unvoreingenommene Schätzer und Bayes-Schätzer. Er vereinfacht das Problem bei der Auswahl des größten Effekts, der ein Behandlungseffekt sein könnte. Dann, sagt er, sind unvoreingenommene Schätzer von Selektionsverzerrungen betroffen. Er benutzte das Beispiel: Nimm
Die besorgniserregende Aussage von Dawid, Efron und anderen Autoren ist jedoch, dass Bayes-Schätzer immun gegen Selektionsverzerrungen sind. Wenn ich nun vor setze , sagen wir δ i ∼ g ( . ) , Dann ist der Bayes-Schätzer von δ i durch E { δ i ∣ Z i } gegeben wobeim(zi)=∫φ(zi-δi)g(δi)dδi
Wenn wir den neuen Schätzer von als γ 2 ( Z ) = max { E { δ 1 ∣ Z 1 } definieren , E { δ 2 ∣ Z 2 } , … , E { δ N ∣ Z N } } , was auch immer i Sie wählen, um δ i max mit γ 1 ( Z zu schätzen
quelle
Antworten:
Wie oben beschrieben, besteht das Problem darin, auf den Index und den Wert (i⁰, μ⁰) des größten Mittelwerts einer Stichprobe normaler rvs zu schließen. Was mich in Dawids Präsentation überrascht, ist, dass die Bayes'sche Analyse nicht so viel Bayes'sch klingt. Wenn die gesamte Stichprobe gegeben ist, sollte ein Bayes'scher Ansatz eine posteriore Verteilung auf (i⁰, μ⁰) erzeugen, anstatt Schätzschritten von der Schätzung von i⁰ bis zur Schätzung des zugehörigen Mittelwerts zu folgen. Und falls erforderlich, sollten Schätzer aus der Definition einer bestimmten Verlustfunktion stammen. Wenn stattdessen der größte Punkt in der Stichprobe und nur dieser Punkt seine Verteilung ändert, ärgert mich die Aussage, dass keine Anpassung erforderlich ist, ziemlich.
Die vorherige Modellierung ist auch insofern ziemlich überraschend, als die Prioritäten auf den Mitteln eher gemeinsam als ein Produkt unabhängiger Normalen sein sollten, da diese Mittel verglichen und daher vergleichbar sind. Zum Beispiel scheint ein hierarchischer Prior angemessener zu sein, wobei Ort und Maßstab aus den gesamten Daten geschätzt werden müssen. Herstellen einer Verbindung zwischen den Mitteln ... Ein relevanter Einwand gegen die Verwendung unabhängiger unzulässiger Prioritäten ist, dass der maximale Mittelwert μ⁰ dann kein genau definiertes Maß hat. Ich denke jedoch nicht, dass eine Kritik an einigen Prioren gegenüber anderen ein relevanter Angriff auf dieses "Paradoxon" ist.
quelle
Even if a bit counter-intuitive the statement is correct. Assumei∗=5 for this experiment, then the posterior for μ5 is really N(x5,σ2) . This counter-intuitive fact is a bit similar to Bayes being immune to (secret) early stopping (that is also very counter-intuitive).
The Bayesian reasoning would lead to false conclusions if for each such experiment (imagine your repeat it a few times), only the results for the best variety would be kept. There would be data selection and Bayesian methods are clearly not immune to (secret) data selection. Actually no statistical method is immune to data selection.
If such a selection was done, a complete Bayesian reasoning taking this selection into account would easily correct the illusion.
However the sentence "Bayes estimator are immune to selection Bias" is a bit dangerous. It is easy to imagine situations where "selection" means something else, like for example selection of explanatory variables, or selection of data. Bayes is not clearly immune to this.
quelle