Können wir uns gleichzeitig eine Wahrscheinlichkeit sowohl im klassischen als auch im subjektiven Sinne vorstellen?

7

Ich bin ein Statistikstudent. Ich versuche, die klassischen und objektiven Definitionen der Wahrscheinlichkeit zu verstehen und wie sie mit der frequentistischen und bayesianischen Folgerung zusammenhängen. Mir ist nicht klar, warum die klassische Wahrscheinlichkeit mit der frequentistischen Inferenz gepaart ist und warum die Bayes'sche Inferenz mit der subjektiven Wahrscheinlichkeit gepaart ist. In einigen Quellen habe ich Aussagen wie die folgenden aus diesem Artikel von Wellek gelesen (Entschuldigung, ich konnte keine Version finden, die sich nicht hinter einer Lohnwand befand):

Populationsparameter sind aus frequentistischer Sicht nicht beobachtbare Konstanten, über die keine aussagekräftigen Wahrscheinlichkeitsaussagen gemacht werden können.

Ich versuche zu verstehen, ob dies auf die klassische Definition der Wahrscheinlichkeit als wiederholte Versuche zurückzuführen ist oder ob dies auf die Einschränkungen der frequentistischen Folgerung zurückzuführen ist.

Meine spezifischen Fragen sind am Ende, wenn die Leser lieber weitermachen möchten, aber ich wollte meine Gedanken teilen, falls dies hilft.

Betrachten wir die Zufallsvariable . Unter der klassischen Definition der Wahrscheinlichkeit, wenn ich die Wahrscheinlichkeit, dass , wissenschaftlich empirisch messen wollte , würde ich denken, dass ich das Experiment nur eine große Anzahl von Malen wiederholen und eine Bilanz ziehen muss. Nach der subjektiven Definition wird von mir erwartet, dass ich zunächst meine eigenen Überzeugungen oder die Überzeugungen eines rationalen Agenten konsultiere. Wenn ich mehr Daten sammle, werden diese Überzeugungen rational geändert.XP(X=x)

Jetzt scheint es mir, dass nicht beobachtet werden kann, so dass es keine Möglichkeit gibt, den Wert von durch mein klassisches empirisches Verfahren zu berechnen . Im Gegensatz dazu kann ich immer an Dinge glauben, die ich nicht direkt beobachten kann, wie Wenn ich also eine Beziehung zwischen Dingen kenne, die ich wie beobachten kann, und Dingen, die ich nicht beobachten kann, wie , kann ich Überzeugungen haben über das ich im Laufe der Zeit rational modifizieren kann.H0|XP(H0|X)H0|XXH0P(H0|X)

Mir fällt ein, dass ich auch argumentieren kann, dass für den Frequentisten sowieso eine feste Eigenschaft des Universums ist, so dass ich vielleicht an der Vorstellung dass fest ist, selbst wenn ich es beobachten könnte. Aber was ist, wenn wir über das typische Experiment nachdenken, eine Münze zu werfen, und es so modifizieren, dass ich einen großen Vorrat an Quartalen habe und jedes Mal, wenn ich einen Wurf aufzeichne, ein neues verwende. In diesem Fall vermute ich, dass es einen zugrunde liegenden Parameter gibt, der münzspezifisch ist, aber ich kann ihn niemals direkt beobachten. Daher ist sinnvoll, aber ich kann es nicht durch direkte Beobachtung von berechnen .H0H0pP(p=0.5|X)p

Also nur um zu meinen allgemeinen Fragen zurückzukehren.

  1. Gibt es eine sinnvolle Möglichkeit, ein Bayes'sches Inferenzverfahren als Frequentist zu interpretieren?

  2. Gibt es eine sinnvolle Möglichkeit, eine Bayes'sche Inferenz durchzuführen, bei der die Wahrscheinlichkeiten gemäß der klassischen Definition der Wahrscheinlichkeit definiert werden?

Kareem Carr
quelle
Das Papier ist auf Sci-Hub erhältlich. Auch: +1
Alexis
3
"Nach Bayes'scher Ansicht ... sind die Daten fixiert", überraschte mich. Ich glaube, dass die Bayesianer den nahezu universellen statistischen Standpunkt vertreten, dass Daten unter Verwendung eines Wahrscheinlichkeitsmodells für sie analysiert werden. Daher bestehen ihre Modelle aus gemeinsamen Verteilungen von Parametern und Daten. In dem Maße, in dem Ihre Fragen auf diesem (falschen?) Verständnis beruhen, möchten Sie sie möglicherweise neu formulieren.
whuber
2
@whuber Okay. Großartig. Vielen Dank, dass Sie dieses Missverständnis ausgeräumt haben. Ich werde es in meine Frage aufnehmen (vorausgesetzt, es gibt eine Version meiner Frage, die immer noch Sinn macht).
Kareem Carr
1
Etwas verwandt: stats.stackexchange.com/a/232507/28666
Amöbe
2
Nach @whubers Kommentar erfordert die Bayes'sche Modellierung ein Modell, damit die Daten eine Wahrscheinlichkeitsfunktion haben. Dann werden die Daten jedoch vollständig konditioniert und als eine Reihe von Konstanten behandelt, um die Verteilungen der unbekannten Parameter zu erhalten.
Frank Harrell

Antworten:

2

Es gibt eine frühere sehr ähnliche Frage bei: Geht es bei der Wahrscheinlichkeit grundsätzlich um Referenzklassen (real oder imaginär)? und ich versuche hier wirklich, beide zu beantworten. Wir müssen mit der Wahrscheinlichkeit beginnen.

Die mathematische Antwort lautet, dass alles, was die üblichen Wahrscheinlichkeitsaxiome erfüllt, eine Wahrscheinlichkeit ist. Aber das beantwortet unsere Frage nicht wirklich! Weil wir wissen , wie wir die Wahrscheinlichkeit nutzen können , wie können wir die Wahrscheinlichkeit interpretieren . In meinem Denken (heute, 7. März 2018, morgen ...) haben alle Wahrscheinlichkeitsvorstellungen (häufig, subjektiv, persönlich, ...) eine wichtige Gemeinsamkeit, die ihnen eine gemeinsame Bedeutung gibt. Das ist das Konzept von Kalibrierungs- oder Referenzklassen . Zur Kalibrierung siehe beispielsweise Visualisierung der Kalibrierung der vorhergesagten Wahrscheinlichkeit eines Modells oder suchen Sie auf dieser Site nach "Kalibrierung". Für Referenzklassen der erste verlinkte Beitrag.

Die Kalibrierung unterscheidet sich in der Art der Referenzklassen, gegen die Sie kalibrieren:

  1. Für die klassische Wahrscheinlichkeit des Frequentismus kalibrieren wir gegen eine genau definierte Menge empirisch beobachtbarer und ähnlicher Ereignisse, wie Wiederholungen von Würfen derselben Münze oder Würfel. Diese Wahrscheinlichkeiten gelten als objektiv, da sich die meisten vernünftigen Personen darauf einigen werden.
  2. Die Buchmacher müssen sich gegen ihren Pool an Spielern kalibrieren, damit seine Gewinne und Verluste auf lange Sicht ausgeglichen sind. Wenn sein Pool von Börsenspekulanten als Kollektiv im Sinne von 1) schlecht kalibriert ist, muss sich der Buchmacher darauf einstellen. Eine andere Art, dies zu sagen, ist, dass die Quoten (oder Wahrscheinlichkeiten) der Buchmacher wirklich Marktpreise sind.
  3. Die subjektive Wahrscheinlichkeit wird von der Person gebildet, die das Urteil fällt und Äquivalenzklassen von Ereignissen mit ungewissem Ergebnis bildet. VeranstaltungenA,Bsind in der gleichen Äquivalenzklasse, wenn diese Person sie als austauschbar beurteilt. Das bedeutet, dass für diese Person in jedem System von Wetten beteiligtA aber nicht B er kann austauschen A zum Bund bewerten Sie die Wette immer noch zum gleichen Preis. Solche Ereignisse müssen die gleiche Wahrscheinlichkeit haben. Die Äquivalenzklassen bestehen also aus Ereignissen, bei denen die gleiche Wahrscheinlichkeit festgestellt wird, und die Kalibrierung erfolgt gegen die langfristige Häufigkeit von Ereignissen in der Klasse.

Wir könnten sagen, dass die Wahrscheinlichkeit ein Janus-Gesicht hat:

Geben Sie hier die Bildbeschreibung ein

(oder vielleicht ist es besser zu sagen, dass die Wahrscheinlichkeit ein vielköpfiger Troll ist!)

Unter diesem Gesichtspunkt scheint es ein Kontinuum von Interpretationen zu geben, von sehr objektiv bis sehr subjektiv! mehr als diskrete unterschiedliche Interpretationen. In diesen Konzepten lassen sich viele praktische Diskussionen über die Wahrscheinlichkeit zusammenfassen. Ein Beispiel: Wie hoch ist die Wahrscheinlichkeit eines Ausbruchs in der Nordsee? Kurz vor dem Bravo-Blowout im Ekofisk-Feld https://en.wikipedia.org/wiki/Ekofisk_oil_fieldDies wurde im Storting besprochen, ein Mitglied fragte, was gegen das Blowout-Risiko unternommen worden sei, und erwähnte Wahrscheinlichkeiten, die aus historischen Erfahrungen aus dem mexikanischen Golf stammen. Der Ölminister Bjartmar Gjerde antwortete, dies erinnere ihn an die Frau, die drei Kinder hatte und nicht mehr wollte, weil sie gehört hatte, dass jedes vierte geborene Kind chinesisch sei ... Am Tag nach dem Ausblasen hatte die Zeitungsdagbladet diesen Titel: "Ein Chinese wird in der Nordsee geboren". Sollten also Erfahrungen aus dem mexikanischen Golf bei der Bildung von Referenzklassen für die Nordsee verwendet oder anders formuliert werden, sollten Blowouts im Golf von Mexiko und in der Nordsee zusammen oder getrennt kalibriert werden? Es gibt keine vollständig objektive Antwort auf solche Fragen, so dass solche Bewertungen teilweise subjektiv sind, selbst wenn wir auf Frequenzinterpretationen abzielen.

"Subjektivität" in "subjektiver Wahrscheinlichkeit" bedeutet also, dass verschiedene vernünftige Personen zu unterschiedlichen Bewertungen kommen können, Referenzklassen auf unterschiedliche Weise definieren können, nicht dass "alles geht". Damit die subjektive Wahrscheinlichkeit aussagekräftig ist, wird erwartet, dass die Referenzklassen (oder das Kalibrierungsverfahren) so explizit wie möglich angegeben werden, damit Diskussion und Kritik möglich werden. Andernfalls degeneriert es einfach zu einem Ratespiel.

In diesem Sinne ist die (subjektive) Wahrscheinlichkeit nur für Ereignisse von Bedeutung, deren Wahrscheinlichkeit kalibriert werden kann. Ein Beispiel, wo dies nicht möglich ist (glaube ich), istP(Does God exist). Eine Kalibrierung ist nicht möglich, daher kann eine solche Wahrscheinlichkeit nicht aussagekräftig gemacht werden. In diesem Sinne können wir über die (subjektive) Wahrscheinlichkeit eines Ereignisses sprechenE nur wenn das Auftreten oder nicht von E wird irgendwann bekannt sein, oder zumindest, dass dies zumindest im Prinzip möglich ist.

Also zu deiner ersten Frage:

Populationsparameter sind aus frequentistischer Sicht nicht beobachtbare Konstanten, über die keine aussagekräftigen Wahrscheinlichkeitsaussagen gemacht werden können.

Nun, der Frequentist entscheidet sich dafür, keine Wahrscheinlichkeitsaussagen über den unbekannten (aber festen) Parameterwert zu machen, aber ist er gezwungen, diese Wahl zu treffen? Jetzt ist er nicht. Lassen Sie als Beispiel den Parameterμrepräsentieren die durchschnittliche Größe von 20 Jahre alten norwegischen Männern. Wir kennen den genauen Wert nicht, daher ist es sinnvoll, Wetten auf Ereignisse (Vorschläge) abzuschließen, die dies betreffenmu, sagen E.={μ<=1,73m}}. Aber oben haben wir gesagt, dass "... wir über die (subjektive) Wahrscheinlichkeit eines Ereignisses sprechen könnenE. nur wenn das Auftreten oder nicht von E. wird irgendwann bekannt sein, ... ". Ist das der Fall von E.? Nicht so formuliert, aber Bayesianer wie deFinetti haben sich intensiv mit diesem Problem befasst und die folgende Lösung herausgebracht. LassenX.=(X.1,X.2,,X.n,)Beobachtung der Körpergröße anhand einer Zufallsstichprobe von 20-jährigen norwegischen Männern. Bevor wir die Probe nehmen, werden wir einige Erwartungen hinsichtlich der möglichen Werte haben. Als Zufallsstichprobe ist die Verteilung vonX.wird austauschbar sein . deFinetti bewies seinen Repräsentationssatz, einen (unendlich) austauschbarenX. kann im Beispiel anhand einer zugrunde liegenden latenten Variablen als bedingt unabhängig dargestellt werden μ (und vielleicht einige andere Parameter als σ) und mit einer vorherigen Verteilung auf diese latenten Variablen / Parameter. Auf diese Weise können wir eine (vorherige) Wahrscheinlichkeitsverteilung auf konstruierenμund denken Sie immer noch an eine unbekannte Konstante! Das kann seltsam aussehen, kann aber gelöst werden, indem man diese Verteilung als epistemisch und nicht als aleatori betrachtet . Auf diese Weise die Wette aufμ kann in eine Wette auf übersetzt werden X., die wir lösen können.

(nicht wirklich fertig, aber es ist spät in der Nacht ...) Ich hoffe, das hilft, ich schreibe das wirklich so viel, um meine Ideen für mich selbst zu klären ... Es gibt viel zu tun, um dieses Setup mathematisch streng zu machen. obwohl ich hoffe, dass das möglich ist. Wenn jemand interessante relevante Referenzen hat, melden Sie sich bitte bei ...

kjetil b halvorsen
quelle
3
Ich denke, einige der besten Überlegungen dazu finden sich in IJ Goods Buch Good Thinking, in dem er ein überzeugendes Argument dafür hat, dass alle Wahrscheinlichkeiten subjektiv sind, aufgrund dessen, was sich in der Gedanken- / Wissensbasis des Beobachters befindet. Wenn nur ein Kartenspieler wüsste, dass eine Karte eine raue Oberfläche hat, hätte dieser Spieler eine andere Wahrscheinlichkeit, dass diese Karte an die Spitze des Decks steigt als die anderen Spieler. (Das war eines von Goods Beispielen)
Frank Harrell