Argumentieren Bayesianer jemals, dass ihr Ansatz den frequentistischen Ansatz verallgemeinert, weil man nicht-informative Prioritäten verwenden und daher eine typische frequentistische Modellstruktur wiederherstellen kann?
Kann mich jemand an einen Ort verweisen, an dem ich über dieses Argument lesen kann, wenn es tatsächlich verwendet wird?
EDIT: Diese Frage ist vielleicht nicht genau so formuliert, wie ich es ausdrücken wollte. Die Frage lautet: "Gibt es einen Hinweis auf die Diskussion der Fälle, in denen sich der Bayes'sche Ansatz und der frequentistische Ansatz überlappen / überschneiden / durch die Verwendung eines bestimmten Prior etwas gemeinsam haben?" Ein Beispiel wäre die Verwendung des falschen vorherigen , aber ich bin mir ziemlich sicher, dass dies nur die Spitze der Spitze des Eisbergs ist.
quelle
Antworten:
Ich habe zwei Argumente vorgebracht, wonach die Bayes'sche Analyse eine Verallgemeinerung einer frequentistischen Analyse ist. Beide waren ein wenig ironisch und brachten die Leute dazu, die Annahmen über Regressionsmodelle zu erkennen, indem sie Priors als Kontext verwendeten.
Argument 1: Frequentistische Analyse ist eine Bayes'sche Analyse mit einem rein nicht informativen Prior, der auf Null zentriert ist (ja, es spielt keine Rolle, wo es zentriert ist, aber ignorieren Sie das). Dies liefert sowohl den Kontext, für den ein Bayesianer die Ergebnisse einer frequentistischen Analyse extrahieren könnte, als auch erklärt, warum Sie mit einigen "Bayesianischen" Techniken wie MCMC davonkommen können, um frequentistische Schätzungen in Situationen zu extrahieren, in denen beispielsweise die Konvergenz mit maximaler Wahrscheinlichkeit schwierig ist Menschen erkennen, dass, wenn sie sagen "Die Daten sprechen für sich selbst" und dergleichen, sie tatsächlich sagen, dass im Voraus alle Werte gleich wahrscheinlich sind.
Argument 2: Jedem Regressionsbegriff, den Sie nicht in ein Modell einbeziehen, wurde im Endeffekt ein Prior zugewiesen, der auf Null zentriert ist und keine Varianz aufweist. Dies ist weniger eine "Bayesianische Analyse ist eine Verallgemeinerung" als vielmehr ein "Es gibt überall Prioritäten , auch in Ihren frequentistischen Modellen".
quelle
Die kurze Antwort lautet wahrscheinlich "Ja - und Sie brauchen nicht einmal eine Wohnung, um dieses Argument zu vertreten."
Die Maximum-A-Posteriori-Schätzung (MAP) ist beispielsweise eine Verallgemeinerung der maximalen Wahrscheinlichkeit, die eine vorherige umfasst, und es gibt häufig vorkommende Ansätze, die analytisch äquivalent sind, um diesen Wert zu ermitteln. Der Frequentist bezeichnet "den Prior" als "Einschränkung" oder "Strafe" für die Wahrscheinlichkeitsfunktion und erhält die gleiche Antwort. So können Frequentisten und Bayesianer auf dasselbe als beste Parameterschätzung verweisen, auch wenn die Philosophien unterschiedlich sind. Abschnitt 5 dieser Veröffentlichung ist ein Beispiel, in dem sie gleichwertig sind.
Die längere Antwort lautet eher "Ja, aber es gibt oft andere Aspekte der Analyse, die die beiden Ansätze unterscheiden. Trotzdem sind selbst diese Unterscheidungen in vielen Fällen nicht unbedingt eisern gekleidet."
Während Bayesianer beispielsweise manchmal die MAP-Schätzung (posteriorer Modus) verwenden, wenn dies zweckmäßig ist, betonen sie stattdessen in der Regel den posterioren Mittelwert. Andererseits hat der hintere Mittelwert auch ein häufig vorkommendes Analogon, das als "Bagged" -Schätzung (aus der "Bootstrap-Aggregation") bezeichnet wird und fast nicht zu unterscheiden ist ( ein Beispiel für dieses Argument finden Sie in diesem PDF ). Das ist also auch keine wirklich "harte" Unterscheidung.
In der Praxis bedeutet dies alles, dass selbst wenn ein Frequentist etwas tut, was ein Bayesianer für völlig illegal hält (oder umgekehrt), es oft (zumindest im Prinzip) eine Annäherung des anderen Lagers gibt, die fast die gleiche Antwort liefert.
Die Hauptausnahme ist, dass einige Modelle aus der Sicht des Frequentisten schwer zu finden sind, aber das ist eher ein praktisches als ein philosophisches Problem.
quelle
Edwin Jaynes war einer der besten, der die Zusammenhänge zwischen bayesianischer und frequentistischer Folgerung hervorhob. Sein Papier- Konfidenzintervall im Vergleich zum Bayes-Intervall (Google Search bringt es auf den Punkt ) ist ein sehr gründlicher Vergleich - und ich denke, ein fairer.
Die Schätzung kleiner Bereiche ist ein weiterer Bereich, in dem ML / REML / EB / HB-Antworten in der Regel nahe beieinander liegen.
quelle
Viele dieser Kommentare gehen davon aus, dass "Frequentist" "Maximum-Likelihood-Schätzung" bedeutet. Einige Leute haben eine andere Definition: "Frequentist" bedeutet eine Art Analyse der langfristigen inferentiellen Eigenschaften einer Inferenzmethode - ob es sich um eine Bayes'sche Methode, eine Methode der Momente oder eine Maximum-Likelihood-Methode handelt oder um etwas Unwahrscheinliches Begriffe (zB SVM's) usw.
quelle
Ich würde gerne von Stephane oder einem anderen Bayesianischen Experten darüber hören. Ich würde nein sagen, weil es ein anderer Ansatz ist, keine Verallgemeinerung. In einem anderen Zusammenhang wurde dies hier zuvor argumentiert. Denken Sie nicht, dass eine Bayes'sche Methode mit einem flachen Prior häufig vorkommt, nur weil flache Priors Ergebnisse liefern, die der maximalen Wahrscheinlichkeit nahe kommen! Ich denke, das wäre eine falsche Vermutung, die Sie zu der Annahme veranlassen würde, dass Sie, indem Sie das Vorherige willkürlich machen, auf andere mögliche Prioritäten verallgemeinern. Ich denke nicht so und ich bin mir ziemlich sicher, dass die meisten Bayesianer dies auch nicht tun.
Einige Leute argumentieren, aber ich denke nicht, dass sie als Bayesianer klassifiziert werden sollten
obwohl Stephane auf die Schwierigkeit einer starken Klassifizierung hingewiesen hat. Wenn das Wort jemals verwendet wird, hängt es wahrscheinlich davon ab, wie Sie Bayesian definieren.
quelle