Wann sind Bayes'sche Methoden Frequentisten vorzuziehen?

16

Ich möchte wirklich etwas über Bayesianische Techniken lernen, also habe ich versucht, mich selbst ein bisschen beizubringen. Es fällt mir jedoch schwer zu sehen, ob Bayesianische Techniken jemals einen Vorteil gegenüber Frequentist-Methoden bringen. Zum Beispiel: Ich habe in der Literatur gesehen, wie einige informative Prioritäten verwenden, während andere nicht informative Prioritäten verwenden. Aber wenn Sie einen nicht informativen Prior verwenden (was scheint wirklich üblich zu sein?) Und feststellen, dass es sich bei der hinteren Verteilung beispielsweise um eine Beta-Verteilung handelt ... hätten Sie am Anfang nicht einfach eine Beta-Verteilung anpassen und anrufen können es gut? Ich verstehe nicht, wie die Erstellung einer vorherigen Distribution, die Ihnen nichts sagt, Ihnen wirklich etwas sagen kann.

Es stellt sich heraus, dass einige Methoden, die ich in R verwendet habe, eine Mischung aus Bayes'schen und Frequent'schen Methoden verwenden (die Autoren erkennen, dass dies etwas inkonsistent ist), und ich kann nicht einmal erkennen, welche Teile Bayes'sch sind. Abgesehen von der Verteilungsanpassung kann ich nicht einmal herausfinden, wie Sie Bayes'sche Methoden anwenden würden. Gibt es eine "Bayes'sche Regression"? Wie würde das aussehen? Alles, was ich mir vorstellen kann, ist, die zugrunde liegende Verteilung immer wieder zu erraten, während der Frequentist über die Daten nachdenkt, sie im Auge behält, eine Poisson-Verteilung sieht und eine GLM ausführt. (Dies ist keine Kritik ... ich verstehe es einfach nicht!)

Vielleicht helfen einige elementare Beispiele? Und wenn Sie einige praktische Hinweise für echte Anfänger wie mich kennen, wäre das auch sehr hilfreich!

HFBrowning
quelle
Mögliches Duplikat davon ?
Glen_b
Äh, sieht aus wie? Willkommen zu schließen, da dies der Beantwortung meiner Frage nahe kommt. Ich wundere mich immer noch über die einfacheren Situationen, die ich beschrieben habe (da ich noch nie von den Techniken in diesem Thread gehört habe), aber ich nehme an, meine Antwort ist, dass Leute KEINE Bayesianischen Techniken für Regressionen / etc. verwenden, weil etablierte und einfache Techniken für Frequentisten existieren.
HFBrowning
2
Die Menschen haben Bayesian Techniken zur Regression verwenden. Aber weil die Methoden des Frequentismus sehr praktisch sind und viele Menschen pragmatisch darüber nachdenken, welchen Ansatz sie verwenden, verwenden Menschen, die beide gerne anwenden, häufig die normale Regression, wenn es nicht erforderlich ist, etwas Komplizierteres zu tun. Aber sobald Sie sich mit ein bisschen mehr Komplexität auseinandersetzen oder formelle Vorinformationen oder eine Reihe anderer Gründe berücksichtigen müssen, sieht die bescheidene Zusatzarbeit in Bayes'schen Ansätzen gut aus.
Glen_b
Das macht Sinn, danke. Das Durchlesen einiger anderer Threads hat die Verwendung auch für mich verdeutlicht.
HFBrowning
Etwas anderes, das für die Regression in einer Bayes'schen Umgebung relevant ist. Die am häufigsten verwendeten Prioritäten für die Koeffizienten sind die multivariate Norm und die multivariate Laplace. Die Verwendung dieser Prioritäten führt zu einer Verschlechterung der Koeffizienten, die der Verwendung der Ridge-Regression bzw. des LASSO entspricht, wenn die MAP-Schätzung der Koeffizienten nach einem Bayes'schen Algorithmus vorgenommen wird. Es ist viel wirtschaftlicher, diese Ergebnisse auf eine Art und Weise zu berechnen, die nicht vollständig bayesianisch ist.

Antworten:

10

Hier sind einige Links, die Sie interessieren könnten, wenn Sie frequentistische und bayesianische Methoden vergleichen:

Kurz gesagt, so wie ich es verstanden habe, glaubt der Frequentist angesichts eines bestimmten Datensatzes, dass es eine wahre, zugrunde liegende Verteilung gibt, aus der diese Daten generiert wurden. Die Unfähigkeit, die genauen Parameter zu erhalten, ist eine Funktion der endlichen Probengröße. Die Bayesianer denken hingegen, dass wir mit einer gewissen Annahme über die Parameter beginnen (auch wenn dies nicht bekannt ist) und die Daten verwenden, um unsere Meinung über diese Parameter zu verfeinern. Beide versuchen, ein Modell zu entwickeln, das die Beobachtungen erklären und Vorhersagen treffen kann. Der Unterschied liegt in den Annahmen (sowohl tatsächlich als auch philosophisch). Als markante, nicht strenge Aussage kann man sagen, dass der Frequentist der Ansicht ist, dass die Parameter festgelegt und die Daten zufällig sind; Der Bayesianer glaubt, die Daten seien fest und die Parameter seien zufällig. Was ist besser oder besser? Um das zu beantworten, muss man sich nur einarbeiten und begreifenWelche Annahmen gehen jeweils einher (z. B. sind Parameter asymptotisch normal?).

Avraham
quelle
2
Viele tolle und interessante Antworten, aber dies beantwortete meine Fragen am direktesten. Danke
HFBrowning
@Avraham der erste Link ist kaputt
Erik Hambardzumyan vor
8

Einer der vielen interessanten Aspekte der Kontraste zwischen den beiden Ansätzen ist, dass es sehr schwierig ist, für viele Größen, die wir im Bereich der Frequentisten erhalten, eine formale Interpretation zu erhalten. Ein Beispiel ist die zunehmende Bedeutung von Bestrafungsmethoden (Schrumpfung). Wenn man bestrafte Höchstwahrscheinlichkeitsschätzungen erhält, sind die voreingenommenen Punktschätzungen und "Konfidenzintervalle" sehr schwer zu interpretieren. Andererseits hat die Bayes'sche posteriore Verteilung für Parameter, die unter Verwendung einer um Null konzentrierten vorherigen Verteilung gegen Null abgestraft werden, vollständig Standardinterpretationen.

Frank Harrell
quelle
1
Das ist ein guter Punkt. Ich frage mich, ob es in erster Linie wahr ist, wenn Lambda von vornherein ausgewählt wird. Oft kann man Lambda durch Kreuzvalidierung auswählen, um den Vorhersagefehler außerhalb der Stichprobe zu optimieren. In diesem Fall finde ich es seltsam, zu sagen, dass das Lambda der „Vorinformation“ entspricht, die Sie für die Analyse herangezogen haben.
gung - Wiedereinsetzung von Monica
1
λ=σ2λ
3
Ich würde sagen, Lambda war ein Hyperparameter des Priores (für den Bayesianer könnte man auch einen Hyperprior haben und darüber hinaus marginalisieren )
Dikran Marsupial
5

Ich klaue diesen Großhandel von der Stan-Nutzergruppe. Michael Betancourt lieferte diese wirklich gute Diskussion über die Identifizierbarkeit in der Bayes'schen Folgerung, die meines Erachtens Ihren Wunsch nach einem Kontrast zwischen den beiden statistischen Schulen widerspiegelt.

Der erste Unterschied zu einer Bayes'schen Analyse ist das Vorhandensein von Prioren, die, selbst wenn sie schwach sind, die posteriore Masse für diese 4 Parameter in eine endliche Nachbarschaft einschränken (sonst hätten Sie überhaupt keine gültige Prioren gehabt). Trotzdem können Sie immer noch eine Nichtidentifizierbarkeit in dem Sinne haben, dass der Posterior nicht zu einer Punktmasse im Grenzbereich unendlicher Daten konvergiert. In einem sehr realen Sinne spielt dies jedoch keine Rolle, da (a) das unendliche Datenlimit sowieso nicht real ist und (b) Bayes'sche Inferenz keine Punktschätzungen, sondern Verteilungen angibt. In der Praxis führt eine solche Nichtidentifizierbarkeit zu großen Korrelationen zwischen den Parametern (möglicherweise sogar zu einer Nichtkonvexität), aber eine ordnungsgemäße Bayes'sche Analyse wird diese Korrelationen identifizieren. Selbst wenn Sie einzelne Parameter-Ränder melden,

μ1μ2N(x|μ1+μ2,σ)μ1+μ2=0μ1μ2

μ1μ2μ1μ2

Sycorax sagt Reinstate Monica
quelle
3

Der Hauptunterschied zwischen Bayes'schen und frequentistischen Ansätzen liegt in der Definition einer Wahrscheinlichkeit. Wenn es also notwendig ist, Wahrscheinlichkeiten streng als langfristige Häufigkeit zu behandeln, sind frequentistische Ansätze angemessen, wenn dies nicht der Fall ist, sollten Sie einen Bayes'schen Ansatz verwenden. Wenn eine der beiden Interpretationen akzeptabel ist, sind bayesianische und frequentistische Ansätze wahrscheinlich vernünftig.

Eine andere Art, es auszudrücken, ist, wenn Sie wissen möchten, welche Schlussfolgerungen Sie aus einem bestimmten Experiment ziehen können, möchten Sie wahrscheinlich Bayesianer sein; Wenn Sie Rückschlüsse auf eine bestimmte Population von Experimenten ziehen möchten (z. B. Qualitätskontrolle), sind frequentistische Methoden gut geeignet.

Im Wesentlichen ist es wichtig zu wissen, welche Frage beantwortet werden soll, und die Analyseform zu wählen, die die Frage am unmittelbarsten beantwortet.

Dikran Beuteltier
quelle