Der modifizierte Bayes-Satz von XKCD: eigentlich ein bisschen vernünftig?

81

Ich weiß, dass dies von einem Comic stammt, der dafür bekannt ist, bestimmte analytische Tendenzen auszunutzen , aber nach ein paar Minuten des Starrens sieht es tatsächlich vernünftig aus. Kann mir jemand erklären, was dieses " modifizierte Bayes-Theorem " tut?

eric_kernfeld
quelle
4
explainxkcd.com/wiki/index.php/2059:_Modified_Bayes%27_Theorem die Erklärung des Autors.
Tschallacka
50
@Tschallacka Was lässt dich denken, dass Randall das geschrieben hat?
Kasperd
16
@Tschallacka es sei denn, einer der Autoren ist Randall selbst, ist dies nicht der Fall.
SQB
Aber sollten Sie nicht den Bayes-Satz auf P (C) anwenden, um seinen Wert angesichts weiterer Beweise zu aktualisieren?
Yakk
1
Ich bin mir ziemlich sicher, dass das da nur eine witzige Ergänzung ist. P(C)
Ian MacDonald

Antworten:

107

Durch Verteilen des -Terms erhalten wir das wir als das Gesetz der Gesamtwahrscheinlichkeit interpretieren können das auf das Ereignis angewendet wird "Sie verwenden die Bayes'schen Statistiken korrekt." Also , wenn Sie Bayes - Statistik korrekt verwenden, dann erholen Sie Bayes' Gesetz (die linke Fraktion oben) , und wenn Sie es nicht sind, dann ignorieren Sie die Daten und benutzen Sie einfach Ihre vor auf .P(H)

P(H|X)=P(X|H)P(H)P(X)P(C)+P(H)[1-P(C)],
C=H

Ich nehme an, dies ist eine Gegenerwiderung gegen die Kritik, dass die Bayesianer im Prinzip die Prioritäten anpassen können, um jede Schlussfolgerung zu unterstützen, die sie wollen, während die Bayesianer argumentieren würden, dass die Bayesianische Statistik nicht so funktioniert.

(Und ja, Sie haben mich erfolgreich verprügelt . Ich bin jedoch weder Mathematiker noch Physiker, daher bin ich mir nicht sicher, wie viele Punkte ich wert bin.)

tddevlin
quelle
60
Ein cleverer Witz, der in der obigen Formel enthalten ist, ist, dass Ihre Schlussfolgerung völlig unabhängig von der Wahrheit ist, wenn Sie die Bayes'schen Statistiken nicht korrekt verwenden.
Cliff AB
25
Ich hoffe, Sie haben Ihre Antwort nicht getippt, als Sie eine belebte Straße überquert haben. Ich werde keine Rolle dabei spielen ...
eric_kernfeld 16.10.18
6
Die Art der oben karikierten Bayesianer ist keine bayesianische Statistik, sie sind bayesianische Anwälte
kjetil b halvorsen
4
@CliffAB Ich weiß nicht, ob ich das einen cleveren Witz oder ein Naturgesetz nennen würde.
eric_kernfeld
7
@CLiffAB Meinst du "Dein posterior (wie nach dieser Formel berechnet) ist unabhängig von den Beweisen"?
Kumulierung
31

Ob Sie es glauben oder nicht, diese Art von Modell taucht gelegentlich in sehr ernsthaften statistischen Modellen auf, insbesondere wenn es um die Datenfusion geht, dh wenn versucht wird, Schlussfolgerungen von mehreren Sensoren zu kombinieren, um Schlussfolgerungen für ein einziges Ereignis zu ziehen.

EINBEINist wahr (dh die hintere Wahrscheinlichkeit, dass dieser eine Sensor fehlzündet, wird sehr hoch, wenn wir erkennen, dass er allen anderen Sensoren widerspricht). Ist die Fehlerverteilung unabhängig von dem Parameter, auf den wir schließen möchten, und ist die hintere Wahrscheinlichkeit, dass es sich um einen Fehler handelt, hoch, haben die Maßnahmen dieses Sensors nur einen geringen Einfluss auf die hintere Verteilung des interessierenden Parameters. in der Tat Unabhängigkeit, wenn die hintere Wahrscheinlichkeit des Scheiterns 1 ist.

Ist dies ein allgemeines Modell, das bei der Inferenz berücksichtigt werden sollte, dh sollten wir den Bayes-Satz durch einen modifizierten Bayes-Satz ersetzen, wenn wir Bayes-Statistiken erstellen? Nein. Der Grund dafür ist, dass "Bayesianische Statistiken richtig verwenden" nicht nur binär ist (oder, wenn ja, immer falsch ist). Jede Analyse wird Grad an falschen Annahmen haben. Damit Ihre Schlussfolgerungen völlig unabhängig von den Daten sind (was durch die Formel impliziert wird), müssen Sie äußerst schwerwiegende Fehler machen. Wenn "Bayesianische Statistiken falsch verwenden" auf einer beliebigen Ebene bedeuten würde, dass Ihre Analyse völlig unabhängig von der Wahrheit ist, wäre die Verwendung von Statistiken völlig wertlos. Alle Modelle sind falsch, aber einige sind nützlich und das alles.

Cliff AB
quelle
5
Ich denke, wir haben Glück gehabt, als wir herausgefunden haben, dass der statische Fehlermodus unserer Sensoren das eine oder andere Extrem ist. Das Quetschen von Geräuschen ist jedoch viel schwieriger. Es ist wirklich ärgerlich festzustellen, dass der Sensor richtig funktioniert und der empfangene Wert falsch ist, weil das Kabel wie eine Antenne wirkt.
Joshua
@Joshua, hoffentlich habe ich eines Tages Zeit, um Kalman-Filterung für diese Art von Situationen richtig zu lernen (oder schreibt vielleicht jemand eine brillante SE-Antwort, die alles klar macht?).
mbrig
μichN(aiμ,1)t(df=10)ich
Cliff AB