Warum macht das „Wegerklären“ intuitiv Sinn?

36

Ich habe kürzlich ein Prinzip des probabilistischen Denkens kennengelernt, das " Wegerklären " heißt, und ich versuche, eine Intuition dafür zu finden.

Lassen Sie mich ein Szenario aufstellen. Sei das Ereignis, bei dem ein Erdbeben auftritt. Lassen Sie Ereignis das Ereignis sein, dass der lustige grüne Riese durch die Stadt schlendert. Sei der Fall, dass der Boden bebt. Lassen . Wie Sie sehen, kann entweder oder verursachen . $A$ $B$ $C$ $A \perp\!\!\!\perp B$ $A$ $B$ $C$

Ich verwende die Argumentation "weg erklären", wenn auftritt, erhöht sich einer von oder , aber der andere verringert sich, da ich keine alternativen Gründe brauche, um zu erklären, warum aufgetreten ist. Meine gegenwärtige Intuition sagt mir jedoch, dass sowohl als auch zunehmen sollten, wenn auftritt, da das Auftreten von es wahrscheinlicher macht, dass eine der Ursachen für aufgetreten ist. $C$ $P(A)$ $P(B)$ $C$ $P(A)$ $P(B)$ $C$ $C$ $C$

Wie versöhne ich meine gegenwärtige Intuition mit der Idee, weg zu erklären? Wie kann ich erklären, dass und bedingt von abhängig sind ? $A$ $B$ $C$

probability intuition David Faux
quelle

4

Was bedeutet ?

A ⊥ ⊥ B

$A \perp\!\!\!\perp B$

mark999

2

Es bedeutet, dass von unabhängig ist , sorry.

A

$A$

B

$B$

David Faux

1

Ich würde ein Szenario wählen, das Sie weniger verwirrt. "Shaking Ground" könnte die Ursache oder die Wirkung von "Erdbeben" sein, und beide werden wahrscheinlich durch den "grünen Riesen" verursacht. Damit es zu einer Aufklärung kommt, müssen sowohl A als auch B Ursachen von C sein.

Neil G

@ DavidFaux Sie brauchen sich nicht zu entschuldigen. Dies ist die mathematische Standardnotation für die Angabe der Unabhängigkeit von Variablen. Übrigens ein großes Lob für die gute Frage und auch +1, weil der Link, den Sie zur Verfügung stellen, wirklich sehr gut ist! Ich war verwirrt über all diese Konzepte und der Artikel, den Sie zur Verfügung gestellt haben, ist wirklich gut. Vielen Dank! :)

Charlie Parker

39

Klarstellung und Notation

Wenn C auftritt, nimmt eines von P (A) oder P (B) zu, während das andere abnimmt

Das stimmt nicht. Sie haben (implizit und vernünftigerweise) angenommen, dass A (geringfügig) unabhängig von B ist und dass A und B die einzigen Ursachen für C sind. Dies impliziert, dass A und B tatsächlich abhängig sind von C , ihrer gemeinsamen Wirkung. Diese Tatsachen stimmen überein, da es sich beim Wegerklären um P (A | C) handelt, das nicht die gleiche Verteilung wie P (A) hat. Die Konditionierungsbalkennotation ist hier wichtig.

Meine gegenwärtige Intuition sagt mir jedoch, dass sowohl P (A) als auch P (B) zunehmen sollten, wenn C auftritt, da das Auftreten von C es wahrscheinlicher macht, dass eine der Ursachen für C aufgetreten ist.

Sie haben die "Schlussfolgerung aus halbkontrolliertem Abbruch" (siehe unten für Details). Zunächst glauben Sie bereits , dass C anzeigt, dass entweder A oder B passiert ist, sodass Sie nicht mehr sicher sein können, ob A oder B passiert ist, wenn Sie C sehen. Aber wie wäre es mit A und B, wenn C gegeben wird? Nun, dies ist möglich, aber weniger wahrscheinlich als entweder A und nicht B oder B und nicht A. Das ist das 'Wegerklären' und wofür willst du die Intuition.

Intuition

Gehen wir zu einem kontinuierlichen Modell über, damit wir die Dinge leichter visualisieren und über Korrelation als eine bestimmte Form der Nichtunabhängigkeit nachdenken können. Angenommen, die Noten (A) und die Mathe-Noten (B) sind in der Gesamtbevölkerung unabhängig voneinander verteilt. Angenommen, eine Schule lässt einen Schüler mit einer kombinierten Lese- und Mathematiknote über einem bestimmten Schwellenwert zu (C). (Es spielt keine Rolle, wie hoch diese Schwelle ist, solange sie mindestens ein bisschen selektiv ist.)

Hier ist ein konkretes Beispiel: Nehmen Sie eine unabhängige Einheit mit normalverteilten Lese- und Mathematiknoten und eine Stichprobe von Schülern an, die unten zusammengefasst sind. Wenn die Lese- und Mathematikpunktzahl eines Schülers zusammen die Zulassungsschwelle (hier 1,5) überschreitet, wird der Schüler als roter Punkt angezeigt.

als eine Collider-Beziehung zu erklären

Da gute Mathematikergebnisse schlechte Lesewerte ausgleichen und umgekehrt, ist die Anzahl der zugelassenen Schüler so hoch, dass Lesen und Mathematik nun abhängig und negativ korreliert sind (-0,65 hier). Dies gilt auch für die nicht zugelassene Bevölkerung (-0,19 hier).

Wenn Sie also eine zufällig ausgewählte Schülerin treffen und von ihrem hohen Mathe-Score erfahren, sollten Sie damit rechnen, dass sie einen niedrigeren Lesewert hat - der Mathe-Score „erklärt“ ihre Zulassung. Natürlich könnte sie auch einen hohen Lesewert haben - das kommt sicherlich in der Handlung vor - aber es ist weniger wahrscheinlich. Und nichts davon wirkt sich auf unsere frühere Annahme aus, dass keine negative oder positive Korrelation zwischen Mathematik- und Lesewerten in der Allgemeinbevölkerung besteht.

Intuitionsprüfung

Gehen Sie zurück zu einem diskreten Beispiel, das Ihrem Original näher kommt. Betrachten Sie den besten (und vielleicht einzigen) Cartoon zum Thema "Wegerklären".

halbkontrollierter Abriss

Die Regierungsverschwörung ist A, die terroristische Verschwörung ist B und die allgemeine Zerstörung wird als C behandelt, wobei die Tatsache ignoriert wird, dass es zwei Türme gibt. Wenn es klar ist, warum das Publikum ziemlich rational ist, wenn es an der Theorie des Sprechers zweifelt, dann versteht man es, „wegzuerklären“.

Conjugateprior
quelle

3

Ich denke, die Beispiele sind am unglücklichsten, obwohl angenommen wird, dass Mathematik und Lesefähigkeit unabhängig sind, ist dies wahrscheinlich nicht der Fall, was zu einer gewissen Verwirrung in Bezug auf die spätere Verwendung des Begriffs "Tatsache" führt.

Robert Jones

Ich denke, ein besseres Beispiel wäre der Fall einer Person, die ein Pfund von etwas hätte essen können, das Kartoffeln oder Würste gewesen sein könnten. Wenn diese Person während des Versuchszeitraums nicht zugenommen hätte, wäre die Wahrscheinlichkeit geringer, Kartoffeln oder Würste zu sich genommen zu haben, als wenn die Person zugenommen hätte.

Robert Jones

Offensichtlich hätte diese Person stattdessen etwas anderes essen können, und um das Thema weiter zu verwirren, könnte es auch sein, dass sie sich auf die Toilette begeben hat. Es ist also klar, dass man bereit sein muss, nach Erklärungen an anderer Stelle zu suchen.

Robert Jones

@RobertJones, das Beispiel, das ich in der Klasse erhalten habe, war "schlau" und "sportlich" als Zulassungskriterium.

GWG

1

Nach meinem Verständnis wird die geistige und körperliche Fitness im Allgemeinen als korreliert angesehen.

Robert Jones

26

Ich denke, Ihre Intuition ist in Ordnung, aber Ihr Verständnis von "wegerklären" ist falsch.

In dem Artikel, den Sie verlinkt haben

"Wegerklären" ist ein gängiges Argumentationsmuster, bei dem die Bestätigung einer Ursache eines beobachteten oder vermuteten Ereignisses die Notwendigkeit verringert, alternative Ursachen geltend zu machen

(Betonung hinzugefügt)

Das ist ganz anders als bei Ihnen:

Ich verwende die Argumentation "weg erklären", wenn auftritt, erhöht sich einer von oder , aber der andere verringert sich, da ich keine alternativen Gründe brauche, um zu erklären, warum aufgetreten ist. $C$ $P(A)$ $P(B)$ $C$

Sie brauchen nicht nur auftreten es muss auch gewesen weg erklärt durch Bestätigung von oder , bevor Sie die Wahrscheinlichkeit , dass die anderen möglichen Erklärung reduzieren $C$ $A$ $B$

Denken Sie anders darüber nach. Der Boden zittert. Sie beobachten , der Riese irrt herum. Dies erklärt weg , so scheint es unwahrscheinlich, dass es jetzt ein Erdbeben gibt - Sie geben sich mit der riesigen Erklärung zufrieden. Aber den Riesen zu beobachten war der Schlüssel - bis Sie dies als wahrscheinliche Erklärung für das Erdbeben hatten, war nichts erklärt worden. Wenn alles, was Sie hatten, , sind tatsächlich sowohl als auch > bzw. , wie in der Antwort von @ Glen_b angegeben. $B$ $C$ $C$ $P(A|C)$ $P(B|C)$ $P(A)$ $P(B)$

Peter Ellis
quelle

+1 für ein paar der anderen Antworten, aber ich denke nicht, dass der Schwerpunkt meiner Meinung nach auf dem falschen Verständnis des OP von "Wegerklären" liegt.

Peter Ellis

+1: Prägnant und auf den Punkt. Vielleicht möchten Sie auch darauf hinweisen, dass OP möglicherweise auch fehlt, dass A und B Ursachen von C sein müssen.

Neil G

5

In Ermangelung spezifischer zusätzlicher Informationen, die die bedingte Wahrscheinlichkeit von oder ändern , teilt Ihnen die Bayes-Regel mit $A$ $B$

$P(A|C) = \frac{P(C|A)P(A)}{P(C)}$ und ähnlich für $P(B|C)$

Wenn und beide größer als 1 sind (was Sie erwarten würden, wenn das Wort 'Erklärung' 'ist wirklich etwas zu bedeuten), dann werden sowohl als auch bedingter wahrscheinlicher sein, als sie waren, bevor beobachtet wurde. $\frac{P(C|A)}{P(C)}$ $\frac{P(C|B)}{P(C)}$ $A$ $B$ $C$

Es wird von Interesse sein, zu sehen, ob man nach der Beobachtung von Vergleich zu vorher relativ wahrscheinlicher wird . $C$

$\frac{P(A|C)}{P(B|C)} = \frac{P(C|A)P(A)}{P(C|B)P(B)}$

Das heißt, die relative Wahrscheinlichkeit der beiden nach der Beobachtung von ist die relative Wahrscheinlichkeit vor ( ) multipliziert mit dem Verhältnis der bedingten Wahrscheinlichkeiten für die Beobachtung von Berücksichtigung der beiden "Erklärungen". $C$ $P(A)/P(B)$ $C$

Glen_b
quelle

2

Du fragst nach Intuition. Was bedeutet es, dass und unabhängig sind? Das heißt, wenn ich Ihnen sage, dass ich das Monster gerade gesehen habe, ändert sich Ihre Meinung über das Auftreten des Erdbebens nicht. und umgekehrt. Wenn du denkst, dass sowohl als auch hoch sind, und ich sage dir, dass der Boden bebt und es kein Monster in der Stadt gibt, würde das deine Meinung über das nicht ändern Auftreten des Erdbebens, wodurch es wahrscheinlicher wird? $A$ $B$ $P(C\mid A)$ $P(C\mid B)$

Zen
quelle

2

Aus der verknüpften Zusammenfassung geht hervor, dass "Wegerklären" einen Lernmechanismus beschreibt, eine übliche Art und Weise, wie Menschen argumentieren, keine formale Methode der Logik oder Wahrscheinlichkeit. Es ist eine menschenähnliche Denkweise, die formal nicht korrekt ist, genauso wie induktives Denken formal nicht korrekt ist (im Gegensatz zu deduktivem Denken). Daher finde ich die formale Logik und die Wahrscheinlichkeitsantworten sehr gut, aber nicht zutreffend. (Beachten Sie, dass sich die Zusammenfassung in einem Machine Intelligence-Kontext befindet.)

Ihr Riesenbeispiel ist dafür sehr gut. Wir glauben, dass Erdbeben oder Riesen den Boden zum Beben bringen können. Wir glauben aber auch, dass Riesen nicht existieren - oder äußerst unwahrscheinlich sind. Der Boden bebt. Wir werden nicht untersuchen, ob ein Riese herumläuft, sondern ob ein Erdbeben passiert ist. Als wir hören, dass tatsächlich ein Erdbeben stattgefunden hat, sind wir noch mehr davon überzeugt, dass Erdbeben eine angemessene Erklärung für Erschütterungen sind und dass Riesen mit noch größerer Sicherheit nicht existieren oder zumindest noch unwahrscheinlicher sind.

Wir würden nur akzeptieren, dass ein Riese den Boden nur dann zum Beben brachte, wenn: 1) wir tatsächlich Zeuge des Riesen wurden und bereit waren zu glauben, dass wir nicht getäuscht wurden und dass unsere vorherige Annahme, dass Riesen höchst unwahrscheinlich oder unmöglich waren, falsch war, oder 2) Wir könnten die Möglichkeit eines Erdbebens vollständig ausschließen und auch alle Möglichkeiten D, E, F, G, ... ausschließen, an die wir vorher nicht gedacht hatten, die aber jetzt wahrscheinlicher erscheinen als an einen Riesen.

Im riesigen Fall macht es Sinn. Dieser Lernmechanismus (eine Erklärung, die wir wahrscheinlich finden, wird noch wahrscheinlicher und verursacht, dass andere Erklärungen jedes Mal weniger wahrscheinlich werden, wenn diese Erklärung funktioniert) ist im Allgemeinen sinnvoll, wird uns aber auch verbrennen. Die Idee, dass die Erde die Sonne umkreist oder Geschwüre durch Bakterien verursacht werden, hatte beispielsweise Schwierigkeiten, durch "Wegerklären" an Boden zu gewinnen, was wir in diesem Fall als Bestätigungsverzerrung bezeichnen würden.

Die Tatsache, dass sich das Abstract in einer Machine Intelligence-Umgebung befindet, lässt mich auch sagen, dass es sich um einen Lernmechanismus handelt, der häufig von Menschen (und anderen Tieren, wie ich mir vorstellen kann) verwendet wird und der Lernsystemen zugutekommt, obwohl er auch sehr fehlerhaft sein kann. Die KI-Community hat jahrelang formale Systeme ausprobiert, ohne sich der menschlichen Intelligenz anzunähern, und ich glaube, dass sich die Pragmatik gegen den Formalismus durchgesetzt hat. Das "Wegerklären" ist etwas, das wir tun und daher muss die KI es tun.

Wayne
quelle

1

Ich denke, eine einfachere Art, sich das vorzustellen, ist: Wenn es eine Variable so dass das Auftreten von die Wahrscheinlichkeit von und erhöht , dann und $C$ $(0<P(C)<1)$ $C$ $A$ $B$ $A$ $B$ kann nicht unabhängig sein. In Ihrem Beispiel haben Sie tatsächlich Variablen ausgewählt, von denen Sie intuitiv verstehen, dass sie abhängig und nicht unabhängig sind. Das heißt, das Ereignis, dass es zu einem Erdbeben kommt und ein Riese herumstapft, ist nicht unabhängig, da beide eher auftreten, wenn der Boden wackelt. Hier ist ein weiteres Beispiel: Sei C das Ereignis, dass es regnet, und A das Ereignis, dass Sie einen Regenschirm benutzen, und B das Ereignis, dass Sie Regenstiefel tragen. Es ist klar, dass A und B nicht unabhängig voneinander sind, da Sie bei Auftreten von C mit größerer Wahrscheinlichkeit sowohl Galoschen als auch Trage- und Regenschirm tragen. Wenn Sie jedoch in einem Gebiet lebten, in dem es nie geregnet hat, könnten A und B möglicherweise unabhängig voneinander sein. Weder der Regenschirm noch die Galoschen werden als Regenschutz verwendet. Tragen Sie also möglicherweise die Galoschen im Garten und fangen Sie mit dem Regenschirm Fisch.

Hier ist ein Beweis: Angenommen, und sind unabhängig und auch bedingt unabhängig, wenn . $A$ $B$ $C$

$P(AB) = P(A)P(B) = P(A|C)P(B|C)P(C)^2$ da unabhängig von $A$ $B$
$P(AB) = P(AB|C)P(C) = P(A|C)P(B|C)P(C)$ da cond ist. unabhängig von gegeben . $A$ $B$ $C$

Aus 1 und 2 folgt, dass also oder . $P(C) = P(C)^2$ $P(C) = 0$ $P(C) = 1$

guest47
quelle

Ich denke, das OP fragt sich, wie man versteht, dass A und B geringfügig unabhängig, aber abhängig von C sind, und nicht, wie man versteht, dass A und B geringfügig abhängig, aber unabhängig von C sind.

conjugateprior

Warum macht das „Wegerklären“ intuitiv Sinn?

Antworten: