Ich bin ein Statistikstudent. Ich versuche, die klassischen und objektiven Definitionen der Wahrscheinlichkeit zu verstehen und wie sie mit der frequentistischen und bayesianischen Folgerung zusammenhängen. Mir ist nicht klar, warum die klassische Wahrscheinlichkeit mit der frequentistischen Inferenz gepaart ist und warum die Bayes'sche Inferenz mit der subjektiven Wahrscheinlichkeit gepaart ist. In einigen Quellen habe ich Aussagen wie die folgenden aus diesem Artikel von Wellek gelesen (Entschuldigung, ich konnte keine Version finden, die sich nicht hinter einer Lohnwand befand):
Populationsparameter sind aus frequentistischer Sicht nicht beobachtbare Konstanten, über die keine aussagekräftigen Wahrscheinlichkeitsaussagen gemacht werden können.
Ich versuche zu verstehen, ob dies auf die klassische Definition der Wahrscheinlichkeit als wiederholte Versuche zurückzuführen ist oder ob dies auf die Einschränkungen der frequentistischen Folgerung zurückzuführen ist.
Meine spezifischen Fragen sind am Ende, wenn die Leser lieber weitermachen möchten, aber ich wollte meine Gedanken teilen, falls dies hilft.
Betrachten wir die Zufallsvariable . Unter der klassischen Definition der Wahrscheinlichkeit, wenn ich die Wahrscheinlichkeit, dass , wissenschaftlich empirisch messen wollte , würde ich denken, dass ich das Experiment nur eine große Anzahl von Malen wiederholen und eine Bilanz ziehen muss. Nach der subjektiven Definition wird von mir erwartet, dass ich zunächst meine eigenen Überzeugungen oder die Überzeugungen eines rationalen Agenten konsultiere. Wenn ich mehr Daten sammle, werden diese Überzeugungen rational geändert.
Jetzt scheint es mir, dass nicht beobachtet werden kann, so dass es keine Möglichkeit gibt, den Wert von durch mein klassisches empirisches Verfahren zu berechnen . Im Gegensatz dazu kann ich immer an Dinge glauben, die ich nicht direkt beobachten kann, wie Wenn ich also eine Beziehung zwischen Dingen kenne, die ich wie beobachten kann, und Dingen, die ich nicht beobachten kann, wie , kann ich Überzeugungen haben über das ich im Laufe der Zeit rational modifizieren kann.
Mir fällt ein, dass ich auch argumentieren kann, dass für den Frequentisten sowieso eine feste Eigenschaft des Universums ist, so dass ich vielleicht an der Vorstellung dass fest ist, selbst wenn ich es beobachten könnte. Aber was ist, wenn wir über das typische Experiment nachdenken, eine Münze zu werfen, und es so modifizieren, dass ich einen großen Vorrat an Quartalen habe und jedes Mal, wenn ich einen Wurf aufzeichne, ein neues verwende. In diesem Fall vermute ich, dass es einen zugrunde liegenden Parameter gibt, der münzspezifisch ist, aber ich kann ihn niemals direkt beobachten. Daher ist sinnvoll, aber ich kann es nicht durch direkte Beobachtung von berechnen .
Also nur um zu meinen allgemeinen Fragen zurückzukehren.
Gibt es eine sinnvolle Möglichkeit, ein Bayes'sches Inferenzverfahren als Frequentist zu interpretieren?
Gibt es eine sinnvolle Möglichkeit, eine Bayes'sche Inferenz durchzuführen, bei der die Wahrscheinlichkeiten gemäß der klassischen Definition der Wahrscheinlichkeit definiert werden?
quelle
Antworten:
Es gibt eine frühere sehr ähnliche Frage bei: Geht es bei der Wahrscheinlichkeit grundsätzlich um Referenzklassen (real oder imaginär)? und ich versuche hier wirklich, beide zu beantworten. Wir müssen mit der Wahrscheinlichkeit beginnen.
Die mathematische Antwort lautet, dass alles, was die üblichen Wahrscheinlichkeitsaxiome erfüllt, eine Wahrscheinlichkeit ist. Aber das beantwortet unsere Frage nicht wirklich! Weil wir wissen , wie wir die Wahrscheinlichkeit nutzen können , wie können wir die Wahrscheinlichkeit interpretieren . In meinem Denken (heute, 7. März 2018, morgen ...) haben alle Wahrscheinlichkeitsvorstellungen (häufig, subjektiv, persönlich, ...) eine wichtige Gemeinsamkeit, die ihnen eine gemeinsame Bedeutung gibt. Das ist das Konzept von Kalibrierungs- oder Referenzklassen . Zur Kalibrierung siehe beispielsweise Visualisierung der Kalibrierung der vorhergesagten Wahrscheinlichkeit eines Modells oder suchen Sie auf dieser Site nach "Kalibrierung". Für Referenzklassen der erste verlinkte Beitrag.
Die Kalibrierung unterscheidet sich in der Art der Referenzklassen, gegen die Sie kalibrieren:
Wir könnten sagen, dass die Wahrscheinlichkeit ein Janus-Gesicht hat:
(oder vielleicht ist es besser zu sagen, dass die Wahrscheinlichkeit ein vielköpfiger Troll ist!)
Unter diesem Gesichtspunkt scheint es ein Kontinuum von Interpretationen zu geben, von sehr objektiv bis sehr subjektiv! mehr als diskrete unterschiedliche Interpretationen. In diesen Konzepten lassen sich viele praktische Diskussionen über die Wahrscheinlichkeit zusammenfassen. Ein Beispiel: Wie hoch ist die Wahrscheinlichkeit eines Ausbruchs in der Nordsee? Kurz vor dem Bravo-Blowout im Ekofisk-Feld https://en.wikipedia.org/wiki/Ekofisk_oil_fieldDies wurde im Storting besprochen, ein Mitglied fragte, was gegen das Blowout-Risiko unternommen worden sei, und erwähnte Wahrscheinlichkeiten, die aus historischen Erfahrungen aus dem mexikanischen Golf stammen. Der Ölminister Bjartmar Gjerde antwortete, dies erinnere ihn an die Frau, die drei Kinder hatte und nicht mehr wollte, weil sie gehört hatte, dass jedes vierte geborene Kind chinesisch sei ... Am Tag nach dem Ausblasen hatte die Zeitungsdagbladet diesen Titel: "Ein Chinese wird in der Nordsee geboren". Sollten also Erfahrungen aus dem mexikanischen Golf bei der Bildung von Referenzklassen für die Nordsee verwendet oder anders formuliert werden, sollten Blowouts im Golf von Mexiko und in der Nordsee zusammen oder getrennt kalibriert werden? Es gibt keine vollständig objektive Antwort auf solche Fragen, so dass solche Bewertungen teilweise subjektiv sind, selbst wenn wir auf Frequenzinterpretationen abzielen.
"Subjektivität" in "subjektiver Wahrscheinlichkeit" bedeutet also, dass verschiedene vernünftige Personen zu unterschiedlichen Bewertungen kommen können, Referenzklassen auf unterschiedliche Weise definieren können, nicht dass "alles geht". Damit die subjektive Wahrscheinlichkeit aussagekräftig ist, wird erwartet, dass die Referenzklassen (oder das Kalibrierungsverfahren) so explizit wie möglich angegeben werden, damit Diskussion und Kritik möglich werden. Andernfalls degeneriert es einfach zu einem Ratespiel.
In diesem Sinne ist die (subjektive) Wahrscheinlichkeit nur für Ereignisse von Bedeutung, deren Wahrscheinlichkeit kalibriert werden kann. Ein Beispiel, wo dies nicht möglich ist (glaube ich), istP.( Existiert Gott ) . Eine Kalibrierung ist nicht möglich, daher kann eine solche Wahrscheinlichkeit nicht aussagekräftig gemacht werden. In diesem Sinne können wir über die (subjektive) Wahrscheinlichkeit eines Ereignisses sprechenE. nur wenn das Auftreten oder nicht von E. wird irgendwann bekannt sein, oder zumindest, dass dies zumindest im Prinzip möglich ist.
Also zu deiner ersten Frage:
Nun, der Frequentist entscheidet sich dafür, keine Wahrscheinlichkeitsaussagen über den unbekannten (aber festen) Parameterwert zu machen, aber ist er gezwungen, diese Wahl zu treffen? Jetzt ist er nicht. Lassen Sie als Beispiel den Parameterμ repräsentieren die durchschnittliche Größe von 20 Jahre alten norwegischen Männern. Wir kennen den genauen Wert nicht, daher ist es sinnvoll, Wetten auf Ereignisse (Vorschläge) abzuschließen, die dies betreffenm u , sagen E.= { μ < = 1,73 m } . Aber oben haben wir gesagt, dass "... wir über die (subjektive) Wahrscheinlichkeit eines Ereignisses sprechen könnenE. nur wenn das Auftreten oder nicht von E. wird irgendwann bekannt sein, ... ". Ist das der Fall von E. ? Nicht so formuliert, aber Bayesianer wie deFinetti haben sich intensiv mit diesem Problem befasst und die folgende Lösung herausgebracht. LassenX.= (X.1,X.2, … ,X.n, … ) Beobachtung der Körpergröße anhand einer Zufallsstichprobe von 20-jährigen norwegischen Männern. Bevor wir die Probe nehmen, werden wir einige Erwartungen hinsichtlich der möglichen Werte haben. Als Zufallsstichprobe ist die Verteilung vonX. wird austauschbar sein . deFinetti bewies seinen Repräsentationssatz, einen (unendlich) austauschbarenX. kann im Beispiel anhand einer zugrunde liegenden latenten Variablen als bedingt unabhängig dargestellt werden μ (und vielleicht einige andere Parameter als σ ) und mit einer vorherigen Verteilung auf diese latenten Variablen / Parameter. Auf diese Weise können wir eine (vorherige) Wahrscheinlichkeitsverteilung auf konstruierenμ und denken Sie immer noch an eine unbekannte Konstante! Das kann seltsam aussehen, kann aber gelöst werden, indem man diese Verteilung als epistemisch und nicht als aleatori betrachtet . Auf diese Weise die Wette aufμ kann in eine Wette auf übersetzt werden X. , die wir lösen können.
(nicht wirklich fertig, aber es ist spät in der Nacht ...) Ich hoffe, das hilft, ich schreibe das wirklich so viel, um meine Ideen für mich selbst zu klären ... Es gibt viel zu tun, um dieses Setup mathematisch streng zu machen. obwohl ich hoffe, dass das möglich ist. Wenn jemand interessante relevante Referenzen hat, melden Sie sich bitte bei ...
quelle