Akzeptieren die Bayesianer Kolmogorovs Axiome?

24

In der Regel wird die Wahrscheinlichkeitstheorie mit Kolgomorovs Axiomen unterrichtet. Akzeptieren die Bayesianer auch Kolmogorovs Axiome?

Handschriftlich
quelle
8
Die Bayes'sche Theorie folgt aus den Standardaxiomen der Wahrscheinlichkeit, daher aus den Kolmogorov-Axiomen.
Xi'an
3
@ Xi'an: Dass subjektive Glaubensgrade durch Wahrscheinlichkeit dargestellt werden können, ist nicht so offensichtlich - daher die Frage, & Ramsey & de Finettis Arbeit.
Scortchi
2
Deshalb bin ich ein "objektiver" Bayesianer und beginne mit früheren Verteilungen, die gemäß den Standards der Wahrscheinlichkeitstheorie definiert wurden ...
Xi'an
2
Ich glaube, dass die Cox-Jaynes-Interpretation der Wahrscheinlichkeit eine strenge Grundlage für die Bayes'sche Wahrscheinlichkeit darstellt. (siehe meine Antwort). Es wäre jedoch schön, Xi'ans Meinung dazu zu haben.
Gipfeltreffen
1
@Summit: danke aber ich fürchte ich interessiere mich nicht sehr für das thema ...!
Xi'an

Antworten:

25

Meiner Meinung nach liefert die Cox-Jaynes-Interpretation der Wahrscheinlichkeit eine strenge Grundlage für die Bayes'sche Wahrscheinlichkeit:

  • Cox, Richard T. "Wahrscheinlichkeit, Häufigkeit und angemessene Erwartung." American Journal of Physics 14.1 (1946): 1-13.
  • Jaynes, Edwin T. Wahrscheinlichkeitstheorie: die Logik der Wissenschaft. Cambridge University Press, 2003.
  • Beck, James L. "Bayesianische Systemidentifikation basierend auf Wahrscheinlichkeitslogik." Strukturelle Kontrolle und Gesundheitsüberwachung 17.7 (2010): 825-847.

Die von Cox abgeleiteten Axiome der Wahrscheinlichkeitslogik sind:

  1. (P1): ( Konvention)Pr[b|a]0
  2. (P2): (Negationsfunktion)Pr[b¯|a]=1Pr[b|a]
  3. (P3): (Konjunktionsfunktion)Pr[bc|a]=Pr[c|ba]Pr[b|a]

Die Axiome P1-P3 implizieren Folgendes (Beck, James L. "Bayesianische Systemidentifikation basierend auf der Wahrscheinlichkeitslogik." Structural Control and Health Monitoring 17.7 (2010): 825-847):

  1. (P4): a) ; b) ; c)Pr [ ¯ b | b c ] = 0 Pr [ b | c ] [ 0 , 1 ]Pr[b|bc]=1Pr[b¯|bc]=0Pr[b|c][0,1]
  2. (P5): a) , b) , wobei bedeutet, dass in , und bedeutet, dass gleich .Pr [ a | c ( a b ) ] = Pr [ b | c ( a b ) ] a b a c a b a bPr[a|c(ab)]Pr[b|c(ab)]Pr[ein|c(einb)]=Pr[b|c(einb)]einbeinceinbab
  3. (P6):Pr[ab|c]=Pr[a|c]+Pr[b|c]Pr[ab|c]
  4. (P7): Angenommen, Satz besagt, dass einer der Sätze wahr ist, dann: b 1 , , b Ncb1,,bN
    • a) Marginalisierungssatz:Pr[a|c]=n=1NP[abn|c]
    • b) Gesamtwahrscheinlichkeitssatz:Pr[a|c]=n=1NPr[a|bnc]Pr[bn|c]
    • c) Bayessatz: Für :Pr [ b k | a c ] = Pr [ a | b kc ] Pr [ b k | c ]k=1,,NPr[bk|ac]=Pr[a|bkc]Pr[bk|c]n=1NPr[a|bnc]Pr[bn|c]

Sie implizieren Kolmogorovs Logikerklärung, die als Sonderfall angesehen werden kann.

Bei meiner Interpretation eines Bayes'schen Standpunkts ist alles (implizit) immer von unserem Glauben und unserem Wissen abhängig.

Der folgende Vergleich stammt von Beck (2010): Bayesianische Systemidentifikation basierend auf der Wahrscheinlichkeitslogik

Der bayesianische Standpunkt

Die Wahrscheinlichkeit ist ein Maß für die Plausibilität einer Aussage auf der Grundlage bestimmter Informationen.

  1. Wahrscheinlichkeitsverteilungen repräsentieren Zustände plausiblen Wissens über Systeme und Phänomene, nicht deren inhärente Eigenschaften.
  2. Die Wahrscheinlichkeit eines Modells ist ein Maß für seine Plausibilität im Vergleich zu anderen Modellen in einer Menge.
  3. Quantifiziert die Unsicherheit aufgrund fehlender Informationen pragmatisch, ohne zu behaupten, dass dies auf die Zufälligkeit der Natur zurückzuführen ist.

Die häufigste Sichtweise

Wahrscheinlichkeit ist die relative Häufigkeit des Auftretens eines inhärent zufälligen Ereignisses auf lange Sicht .

  1. Wahrscheinlichkeitsverteilungen sind inhärente Eigenschaften zufälliger Phänomene.
  2. Eingeschränkter Geltungsbereich, z. B. keine Bedeutung für die Wahrscheinlichkeit eines Modells.
  3. Inhärente Zufälligkeit wird angenommen, kann aber nicht nachgewiesen werden.

Wie man Kolmogorovs Axiome aus den obigen Axiomen ableitet

Im folgenden Abschnitt 2.2 von [Beck, James L. "Bayes'sche Systemidentifikation basierend auf Wahrscheinlichkeitslogik." Strukturelle Kontrolle und Gesundheitsüberwachung 17.7 (2010): 825-847.] Ist zusammengefasst:

Im Folgenden verwenden wir: Wahrscheinlichkeitsmaß für Teilmenge einer endlichen Menge :A XPr(EIN)EINX

  1. [K1]:Pr(EIN)0,EINX
  2. [K2]:Pr(X)=1
  3. [K3]: wenn und disjunkt sind.A BPr(EINB)=Pr(EIN)+Pr(B),EIN,BXEINB

Um (K1-K3) aus den Axiomen der Wahrscheinlichkeitstheorie abzuleiten, führte [Beck, 2010] Propositon , das angibt und das Wahrscheinlichkeitsmodell für spezifiziert . [Beck, 2010] führt außerdem .x X x Pr ( A ) = Pr [ x A | π ]πxXxPr(EIN)=Pr[xEIN|π]

  • P1 impliziert K1 mit undc = πb={xEIN}c=π
  • K2 folgt aus ; P4 (a) und besagen, dass .π x XPr[xX|π]=1πxX
  • K3 kann von P6 abgeleitet werden: und sind disjunkt bedeutet, dass sich und gegenseitig ausschließen. Daher ist K3:B x A x B Pr ( x A B | π ) = Pr ( x A | π ) + Pr ( x B | π )EINBxEINxB Pr(xEINB|π)=Pr(xEIN|π)+Pr(xB|π)
Gipfel
quelle
5
Von Ihrem K3 gelangen Sie zu (endliche Additivität), aber nicht zu Kolmogorovs 3. Axiom, (abzählbare Additivität), wenn die Elemente eines Feldes sind und nicht nur Teilmengen einer endlichen Menge. Pr(ich=1nEINich)=ich=1nPr(EINich)Pr(ich=1EINich)=ich=1Pr(EINich)EINσ
Scortchi - Wiedereinsetzung von Monica
2
@ Scortchi KRKoch zitiert in seiner Einführung in die Bayesianische Statistik Bernardo und Smith (1994), Bayesian Theory, p. 105, als eine Quelle, die zeigt, wie man mit zählbarer Unendlichkeit umgeht. Ich habe es nicht überprüft, aber als Referenz kann es auch hier angegeben werden.
gwr
12

Nach der Entwicklung der Wahrscheinlichkeitstheorie musste gezeigt werden, dass lockerere Konzepte, die dem Namen "Wahrscheinlichkeit" entsprachen, dem streng definierten Konzept entsprachen, das sie inspiriert hatten. "Subjektive" Bayes'sche Wahrscheinlichkeiten wurden von Ramsey und de Finetti berücksichtigt, die unabhängig voneinander zeigten, dass eine Quantifizierung des Glaubensgrades unter den Bedingungen von Vergleichbarkeit und Kohärenz (Ihre Überzeugungen sind kohärent, wenn niemand ein niederländisches Buch gegen Sie verfassen kann) erforderlich ist eine Wahrscheinlichkeit sein.

Unterschiede zwischen Axiomatisierungen sind größtenteils Geschmackssache in Bezug darauf, was definiert und was abgeleitet werden sollte. Aber zählbare Additivität ist eine von Kolmogorovs, die nicht von Cox oder Finetti abgeleitet werden kann, und wurde kontrovers diskutiert. Einige Bayesianer (z. B. de Finetti & Savage) hören bei der endlichen Additivität auf und akzeptieren daher nicht alle Axiome von Kolmogorov. Sie können gleichmäßige Wahrscheinlichkeitsverteilungen über unendliche Intervalle ohne Unangemessenheit erstellen. Andere folgen Villegas, indem sie ebenfalls monotone Kontinuität annehmen und daraus eine zählbare Additivität ziehen.

Ramsey (1926), "Wahrheit und Wahrscheinlichkeit", in Ramsey (1931), Die Grundlagen der Mathematik und andere logische Aufsätze

de Finetti (1931), "Sul significato soggettivo della probabilità", Fundamenta Mathematicæ , 17 , S. 298 - 329

Villegas (1964), "Über qualitative Wahrscheinlichkeits- Algebren", Ann. Mathematik. Statist. , 35 , 4.σ

Scortchi - Wiedereinsetzung von Monica
quelle
3
Warum sollte sich meine Antwort nur mit objektiven Bayes'schen Wahrscheinlichkeiten befassen? Das wegweisende Werk von Cox (1946) befasst sich explizit mit dem Thema Subjektivität! Es ist ein sehr interessantes und leicht zu lesendes Papier. Ich halte es nicht für sinnvoll, zwischen "subjektiven" und "objektiven" Bayes'schen Wahrscheinlichkeiten zu unterscheiden: Alles ist implizit immer an die Person gebunden, die die Analyse durchführt -> und diesbezüglich "subjektiv".
Gipfeltreffen
Zur Herleitung der Axiome sagte Kolmogorov von Cox: Ich bin zufrieden mit der Art und Weise, wie sie in Abschnitt 2.2 von Beck, James L. "Bayesianische Systemidentifikation basierend auf Wahrscheinlichkeitslogik", durchgeführt wird. Strukturelle Kontrolle und Gesundheitsüberwachung 17.7 (2010): 825-847.
Gipfeltreffen
1
@Summit: (1) Du hast recht; Es ist vielmehr so, dass Ramsey & de Finettis dispositionelle Sichtweise der Wahrscheinlichkeit sie direkt in das "subjektive" Lager bringt, wohingegen die von Cox allgemeiner anwendbar ist. (2) Wollen Sie damit sagen, dass sich aus den Postulaten von Cox abzählbare Additivität ableiten lässt ?
Scortchi - Wiedereinsetzung von Monica
Ich habe meine Antwort erweitert und freue mich auf Ihre Kommentare.
Gipfeltreffen
1
@Summit: Danke - ich hoffe, Zeit zu finden, um meine noch halb so gründlich zu machen. Ich habe auf die Lücke zwischen Cox 'Theorem und den "vollständigen" Kolmogorov-Axiomen hingewiesen und denke, dass diese Frage besonders wichtig ist (obwohl ich sie bei der ersten Beantwortung völlig vergessen hatte). Jaynes hatte einige interessante Dinge über diese BTW zu sagen.
Scortchi