Worum geht es in Bayes 'Theorem?

36

Was sind die Hauptideen, dh Konzepte, die mit dem Bayes-Theorem zusammenhängen ? Ich frage nicht nach Ableitungen der komplexen mathematischen Notation.

user333
quelle
4
Siehe auch
Shane
3
Ich möchte diesen Link auch als einfache
steffen
1
Der Satz von Bayes kann ein Durcheinander ohne visuelle Darstellung sein - wie so oft in der Mathematik. Warum nicht Wahrscheinlichkeitsquadrate oder Wahrscheinlichkeitsbäume für Bayes'sche Wahrscheinlichkeiten verwenden? Wenn die neuen Daten eingehen, wird ein Teil des Probenraums gesperrt (z. B. wenn ein positiver Test für eine Krankheit durchgeführt wird, wird der negative Test beendet). Dann wird der Probenraum nur eine Teilmenge der Wahrscheinlichkeiten, die vielleicht positiv getestet werden, und man berücksichtigt nur dies. Die Schwierigkeit, die ich habe, besteht darin, Bayes auf Wahrscheinlichkeitsverteilungen anstatt auf diskrete Wahrscheinlichkeiten anzuwenden. Die Mathematik ist höllisch schrecklich!

Antworten:

22

Der Satz von Bayes ist ein relativ einfaches, aber grundlegendes Ergebnis der Wahrscheinlichkeitstheorie, das die Berechnung bestimmter bedingter Wahrscheinlichkeiten ermöglicht. Bedingte Wahrscheinlichkeiten sind nur die Wahrscheinlichkeiten, die den Einfluss eines Ereignisses auf die Wahrscheinlichkeit eines anderen widerspiegeln.

In seiner bekanntesten Form heißt es einfach, dass die Wahrscheinlichkeit einer Hypothese bei Vorliegen neuer Daten ( P (H | D) , die als hintere Wahrscheinlichkeit bezeichnet wird) der folgenden Gleichung entspricht: Die Wahrscheinlichkeit der beobachteten Daten bei Vorliegen der Hypothese ( P (D | H) , als bedingte Wahrscheinlichkeit bezeichnet, multipliziert mit der Wahrscheinlichkeit, dass die Theorie wahr ist, bevor neue Beweise vorliegen ( P (H) , als vorherige Wahrscheinlichkeit von H bezeichnet, dividiert durch die Wahrscheinlichkeit, diese Daten zu sehen, Periode ( P (D ), genannt die Grenzwahrscheinlichkeit von D).

Formal sieht die Gleichung so aus:

Alt-Text

Die Bedeutung des Bayes-Theorems beruht im Wesentlichen darauf, dass seine korrekte Verwendung ein Streitpunkt zwischen den Denkschulen über die Wahrscheinlichkeit ist. Für einen subjektiven Bayes'schen Satz (der Wahrscheinlichkeit als subjektiven Grad des Glaubens interpretiert) liefert der Bayes'sche Satz den Eckpfeiler für das Testen von Theorien, die Auswahl von Theorien und andere Praktiken, indem er ihre subjektiven Wahrscheinlichkeitsurteile in die Gleichung einfügt und damit umgeht. Für einen Frequentisten (der Wahrscheinlichkeit als einschränkende relative Häufigkeiten interpretiert ) ist diese Verwendung des Bayes-Theorems ein Missbrauch, und sie bemühen sich stattdessen, sinnvolle (nicht subjektive) Prioritäten zu verwenden (wie dies bei objektiven Bayesianern unter einer weiteren Interpretation der Wahrscheinlichkeit der Fall ist).

John L. Taylor
quelle
1
gute Antwort. Ich habe ein kleines Problem: Die Verwendung des Wortes "subjektiv" und "objektiv" ist nicht ganz angemessen, da keine Methoden "objektiv" sind. Ich würde eher sagen, dass die häufig auftretenden und "objektiven" Bayesianer ihre Wahrscheinlichkeitsverteilungen einfach anhand bestimmter Regeln oder Standards ableiten. Anstatt also auf den konkreten Fall einzugehen, wendet ein häufig auftretender / objektiver Bayesianer "Standard" -Wahlen an (wodurch seine Subjektivität ausgeblendet wird).
Wahrscheinlichkeitslogik
Wenn Sie etwas wirklich Wertvolles messen (sagen wir die Größe von Kindern im Alter von 6 Jahren), was ist dann P (D)? Ist es das PDF der Daten? In diesem Fall berechnen Sie den posterioren Punkt wie folgt: ? P(x|H|D)=P(x|D|H)P(x|H)P(x|D)
naught101
13

Es tut mir leid, aber hier scheint es einige Verwirrung zu geben: Bayes 'Theorem steht nicht zur Diskussion der nie endenden Bayesianisch- Frequentistischen Debatte. Es ist ein Theorem, das mit beiden Denkrichtungen übereinstimmt (vorausgesetzt, es stimmt mit Kolmogorovs Wahrscheinlichkeitsaxiomen überein).

Natürlich ist der Satz von Bayes der Kern der Bayes'schen Statistik, aber der Satz selbst ist universell. Der Konflikt zwischen Frequentisten und Bayesianern hängt hauptsächlich davon ab, wie frühere Verteilungen definiert werden können oder nicht.

Wenn es sich also um die Frage nach dem Bayes-Theorem handelt (und nicht um die Bayes-Statistik):

Der Satz von Bayes definiert, wie man bestimmte bedingte Wahrscheinlichkeiten berechnen kann. Stellen Sie sich zum Beispiel vor, dass Sie wissen: die Wahrscheinlichkeit, dass jemand das Symptom A hat, vorausgesetzt, er hat die Krankheit X p (A | X); die Wahrscheinlichkeit, dass jemand im Allgemeinen an der Krankheit X p (X) leidet; die Wahrscheinlichkeit, dass jemand im Allgemeinen das Symptom A p (A) hat. Mit diesen 3 Informationen können Sie die Wahrscheinlichkeit berechnen, dass jemand an der Krankheit X leidet, vorausgesetzt, er hat das Sympotm A p (X | A).

Dave Kellen
quelle
1
Ich stimme Ihrem ersten Absatz zum Teil nicht zu, weil in den Fragen nach dem Konzept des Bayes-Theorems gefragt wird. Die Debatte zwischen Frequentisten und Bayes ist für diesen Teil der Frage relevant . Die Kolmogorov-Axiome geben dem Bayes-Theorem nicht die gleiche konzeptionelle Bedeutung wie die Axiome "Wahrscheinlichkeit wie erweiterte Logik".
Wahrscheinlichkeitsrechnung
8

P(EIN|B)P(B|EIN)

P(B|EIN)EINP(Würfel landen sechs)P(Würfel landen sechs|Würfel landen gerade)

Sie können den Satz von Bayes wie folgt selbst ableiten. Beginnen Sie mit der Verhältnisdefinition einer bedingten Wahrscheinlichkeit:

P(B|EIN)=P(EINB)P(EIN)

P(EINB)EINBP(EIN)EIN

P(EIN|B)

P(EIN|B)=P(BEIN)P(B)

P(EINB)=P(BEIN)EINB=BEIN

P(EIN|B)=P(EINB)P(B)

P(B|EIN)P(EINB)

P(EINB)=P(EIN|B)P(B)

und hey presto:

P(B|EIN)=P(EIN|B)P(B)P(EIN)

Wenn Sie eine bedingte Wahrscheinlichkeit auf diese Weise drehen möchten, betrachten Sie das übliche Beispiel, bei dem Sie versuchen, auf die Wahrscheinlichkeit einer Erkrankung zu schließen, wenn ein Symptom vorliegt. Wir wissen also, dass ein Symptom vorliegt - wir können es sehen Sie es - aber wir können nicht sicher sein, ob sie eine Krankheit haben und daraus schließen müssen. Ich beginne mit der Formel und arbeite zurück.

P(Krankheit|Symptom)=P(Symptom|Krankheit)P(Krankheit)P(Symptom)

Um das herauszufinden, müssen Sie die vorherige Wahrscheinlichkeit des Symptoms, die vorherige Wahrscheinlichkeit der Krankheit (dh wie häufig oder selten das Symptom und die Krankheit sind) und auch die Wahrscheinlichkeit kennen, dass jemand ein Symptom hat, vorausgesetzt, wir wissen, dass jemand eines hat eine Krankheit (zB durch teure zeitraubende Labortests).

Es kann viel komplizierter werden, z. B. wenn Sie mehrere Krankheiten und Symptome haben, aber die Idee ist dieselbe. Noch allgemeiner erscheint der Satz von Bayes oft, wenn Sie eine Wahrscheinlichkeitstheorie der Beziehungen zwischen Ursachen (z. B. Krankheiten) und Auswirkungen (z. B. Symptome) haben und rückwärts argumentieren müssen (z. B. wenn Sie einige Symptome sehen, von denen Sie sprechen möchten) die zugrunde liegende Krankheit schließen).

AndyF
quelle
5

Es gibt zwei Hauptgedankensrichtungen: die Statistik, die frequentistische und die Bayes'sche .

Der Bayes-Satz hat mit letzterem zu tun und kann als ein Weg gesehen werden, zu verstehen, wie die Wahrscheinlichkeit, dass eine Theorie wahr ist, durch ein neues Beweisstück beeinflusst wird. Dies ist als bedingte Wahrscheinlichkeit bekannt. Vielleicht haben Sie wollen , betrachten dies einen Griff auf die Mathematik zu bekommen.

Tony Breyal
quelle
4

Lassen Sie mich Ihnen einen sehr sehr intuitiven Einblick geben. Angenommen, Sie werfen 10 Mal eine Münze und erhalten 8 Köpfe und 2 Schwänze. Die Frage, die Ihnen in den Sinn kommen würde, ist, ob diese Münze auf Köpfe ausgerichtet ist oder nicht.

Wenn Sie sich nun an konventionelle Definitionen oder den häufigeren Ansatz der Wahrscheinlichkeit halten, könnten Sie sagen, dass die Münze unvoreingenommen ist und dies ein außergewöhnliches Ereignis ist. Sie würden daher den Schluss ziehen, dass die Wahrscheinlichkeit, einen Head-Next-Wurf zu erhalten, ebenfalls 50% beträgt.

Angenommen, Sie sind Bayesianer. Sie würden tatsächlich denken, dass die Münze aufgrund der außergewöhnlich hohen Anzahl von Köpfen eine Neigung zur Kopfseite aufweist. Es gibt Methoden, um diese mögliche Verzerrung zu berechnen. Sie würden sie berechnen und dann, wenn Sie das nächste Mal die Münze werfen, würden Sie definitiv einen Kopf rufen.

Bei der Bayes'schen Wahrscheinlichkeit handelt es sich also um die Annahme, dass Sie sich auf der Grundlage der von Ihnen beobachteten Daten entwickeln. Ich hoffe das war einfach genug.

htrahdis
quelle
Natürlich gibt es mehr Daten in einem Münzwurf als nur das Ergebnis - Ein vernünftiger Bayesianer wird aufgrund des Gewichts vergangener Daten und der Tatsache, dass die Münze und der Münzwurf fair aussehen, wahrscheinlich immer noch sogar wetten. Es sei denn, Sie können die Münze nicht sehen oder die Münze wird geworfen. In diesem Fall wissen Sie nicht einmal, ob die Daten zu Beginn nur gefälscht sind, und Sie können auch Ihre Vorgesetzten aus dem Fenster werfen ...
naught101
3

Der Satz von Bayes bezieht sich auf zwei Ideen: Wahrscheinlichkeit und Wahrscheinlichkeit. Die Wahrscheinlichkeit sagt: Bei diesem Modell sind dies die Ergebnisse. Also: Bei einer fairen Münze bekomme ich in 50% der Fälle Köpfe. Die Wahrscheinlichkeit sagt: Angesichts dieser Ergebnisse können wir dies über das Modell sagen. Also: Wenn Sie eine Münze 100 Mal werfen und 88 Köpfe erhalten (um ein vorheriges Beispiel aufzugreifen und es extremer zu machen), ist die Wahrscheinlichkeit, dass das faire Münzmodell korrekt ist, nicht so hoch.

Eines der Standardbeispiele, die zur Veranschaulichung des Bayes-Theorems verwendet werden, ist die Idee, auf eine Krankheit zu testen: Wenn Sie einen 95% genauen Test für eine Krankheit durchführen, an der 1 von 10000 der Bevölkerung leidet, und positiv testen, wie hoch die Chancen sind dass du die Krankheit hast?

Die naive Antwort ist 95%, aber dies ignoriert das Problem, dass 5% der Tests bei 9999 von 10000 Personen falsch positiv ausfallen. Ihre Wahrscheinlichkeit, an der Krankheit zu erkranken, liegt also weit unter 95%.

Mein Gebrauch der vagen Phrase "Was sind die Chancen" ist absichtlich. Verwendung der Wahrscheinlichkeits- / Wahrscheinlichkeitssprache: Die Wahrscheinlichkeit, dass der Test genau ist, beträgt 95%. Was Sie jedoch wissen möchten, ist die Wahrscheinlichkeit, dass Sie an der Krankheit leiden.

Etwas abseits des Themas: Das andere klassische Beispiel, das mit dem Bayes-Theorem in allen Lehrbüchern gelöst wird, ist das Monty-Hall-Problem: Sie sind in einer Quizshow. Es gibt einen Preis hinter einer von drei Türen. Sie wählen Tür eins. Der Gastgeber öffnet Tür drei und gibt keinen Preis preis. Sollten Sie zu Tür zwei wechseln, wenn Sie die Chance dazu haben?

Die Umformulierung der Frage gefällt mir (mit freundlicher Genehmigung des nachstehenden Verweises): Sie nehmen an einer Quizshow teil. Hinter einer von Millionen Türen steckt ein Preis. Sie wählen Tür eins. Der Gastgeber öffnet alle anderen Türen außer Tür 104632, um keinen Preis preiszugeben. Sollten Sie zur Tür 104632 wechseln?

Mein Lieblingsbuch, das den Bayes-Satz ausführlich aus Bayes-Sicht behandelt, ist "Informationstheorie, Inferenz- und Lernalgorithmen" von David JC MacKay. Es ist ein Buch von Cambridge University Press, ISBN-13: 9780521642989. Meine Antwort ist (wie ich hoffe) eine Destillation der Art von Diskussionen, die in dem Buch geführt werden. (Es gelten die üblichen Regeln: Ich habe keine Beziehung zum Autor, das Buch gefällt mir einfach).


quelle
3

Der Bayes-Satz in seiner offensichtlichsten Form ist einfach eine Wiederholung von zwei Dingen:

  1. P(HD|ich)=P(DH|ich)
  2. P(HD|ich)=P(H|ich)P(D|Hich)

Also unter Verwendung der Symmetrie:

P(HD|ich)=P(H|ich)P(D|Hich)=P(D|ich)P(H|Dich)

P(D|ich)0P(D|ich)

P(H|Dich)=P(H|ich)P(D|Hich)P(D|ich)

So, das ist es? Wie kann etwas so Einfaches so großartig sein? Wie bei den meisten Dingen "ist die Reise wichtiger als das Ziel". Der Bayes-Satz rockt aufgrund der Argumente, die dazu führen.

P(H|ich)=1-P(H¯|ich)

Nun lautet die "Regel" in der deduktiven Logik: Wenn Sie eine Beziehung haben, die "A impliziert B", dann haben Sie auch "Nicht B impliziert Nicht A". Wir haben also "konsequentes Denken impliziert Bayes-Theorem". Dies bedeutet "Nicht-Bayes-Theorem impliziert nicht konsistentes Denken". Das heißt, wenn Ihr Ergebnis aus irgendeinem Grund und mit größerer Wahrscheinlichkeit nicht mit einem Bayes'schen Ergebnis übereinstimmt, argumentieren Sie inkonsistent.

Dieses Ergebnis heißt Cox-Theorem und wurde in den 1940er Jahren in der "Algebra of Probable Inference" bewiesen. Eine neuere Ableitung findet sich in der Proability-Theorie: Die Logik der Wissenschaft.

Wahrscheinlichkeitslogik
quelle
2

Ich mag Kevin Murphys Intro zum Bayes-Theorem http://www.cs.ubc.ca/~murphyk/Bayes/bayesrule.html

Das Zitat hier stammt aus einem Artikel der Ökonomen:

http://www.cs.ubc.ca/~murphyk/Bayes/economist.html

Die Essenz des Bayes'schen Ansatzes besteht darin, eine mathematische Regel bereitzustellen, die erklärt, wie Sie Ihre bestehenden Überzeugungen im Lichte neuer Beweise ändern sollten. Mit anderen Worten, es ermöglicht Wissenschaftlern, neue Daten mit ihrem vorhandenen Wissen oder Know-how zu kombinieren. Das kanonische Beispiel ist die Vorstellung, dass ein frühreifes Neugeborenes seinen ersten Sonnenuntergang beobachtet und sich fragt, ob die Sonne wieder aufgehen wird oder nicht. Er weist beiden möglichen Ergebnissen die gleichen vorherigen Wahrscheinlichkeiten zu und stellt dies dar, indem er einen weißen und einen schwarzen Marmor in eine Tüte legt. Am nächsten Tag, wenn die Sonne aufgeht, legt das Kind einen weiteren weißen Marmor in die Tasche. Die Wahrscheinlichkeit, dass ein Marmor, der nach dem Zufallsprinzip aus der Tüte gezogen wird, weiß ist (dh der Grad des Glaubens des Kindes an zukünftige Sonnenaufgänge), ist somit von einem halben auf zwei Drittel gesunken. Nach Sonnenaufgang am nächsten Tag, Das Kind fügt einen weiteren weißen Marmor hinzu und die Wahrscheinlichkeit (und damit der Grad des Glaubens) steigt von zwei Dritteln auf drei Viertel. Und so weiter. Allmählich ändert sich die anfängliche Überzeugung, dass die Sonne genauso wahrscheinlich wie nicht jeden Morgen aufgehen wird, so, dass nahezu sicher ist, dass die Sonne immer aufgehen wird.

kgarten
quelle