Probleme in der Kausalität aus Judea Pearl Book

11

Ich fange an, Causal Inference in Statistics, A Primer von Judea Pearl et. al. Ich habe einen Master in Mathematik, aber ich habe noch nie einen Statistikkurs belegt. Ich bin ein bisschen verwirrt von einer der frühen Studienfragen, und es gibt niemanden, den ich danach fragen kann. Ich hoffe, dass jemand auf dieser Seite meine Antworten für mich kritisiert. (Dies ist kein Hausaufgabenproblem. Ich bin Rentner und halte nur meine Gedanken aktiv.) Beachten Sie, dass die Probleme keine spezifischen Daten enthalten.

a) Es gibt zwei Behandlungen für Nierensteine, Behandlung A und Behandlung B. Ärzte verschreiben Behandlung A eher bei großen (und daher schwereren) Steinen und eher Behandlung B bei kleinen Steinen. Sollte ein Patient, der die Größe seines Steins nicht kennt, die allgemeinen Bevölkerungsdaten oder die größenspezifischen Daten untersuchen, um festzustellen, welche Behandlung wirksamer ist?

b) In einer kleinen Stadt gibt es zwei Ärzte. Jeder hat in seiner Karriere 100 Operationen durchgeführt, die von zwei Arten sind: eine sehr einfache und eine sehr schwierige Operation. Der erste Arzt führt die einfache Operation viel häufiger durch als die schwierige Operation, und der zweite führt die schwierige Operation häufiger durch als die einfache Operation. Sie müssen operiert werden, wissen aber nicht, ob Ihr Fall einfach oder schwierig ist. Sollten Sie die Erfolgsrate jedes Arztes in allen Fällen konsultieren oder sollten Sie die Erfolgsraten für die einfachen und schwierigen Fälle separat konsultieren, um die Chance auf eine erfolgreiche Operation zu maximieren?

In Bezug auf Teil a) ist anzunehmen, dass Behandlung A im Vergleich zu Behandlung B Nachteile aufweist, oder warum wird sie nicht ständig verschrieben? Es scheint mir also, dass ich keine intelligente Entscheidung treffen kann, ohne die Größe meines Nierensteins zu kennen. Ich würde erwarten, dass die Daten zeigen, dass Behandlung A bei großen Steinen wirksamer und bei kleinen Steinen mindestens genauso wirksam ist, aber ich möchte nicht die vermuteten Risiken von Behandlung A übernehmen, wenn mein Stein klein ist. Unter der Annahme, dass kleine Steine ​​fast immer erfolgreich behandelt werden können, würde ich erwarten, dass Behandlung B eine höhere Erfolgsrate in der Allgemeinbevölkerung aufweist, aber ich würde Behandlung B nicht anwenden wollen, wenn ich einen großen Stein habe.

Es scheint mir, dass die Daten nutzlos sind, wenn ich nicht die Größe meines Steins kenne. Ist das vielleicht die Antwort auf die Frage? Das Ganze scheint ziemlich sinnlos, weil ich nicht in die Apotheke gehen und keine Behandlung über den Ladentisch kaufen kann. Mein Arzt wird es verschreiben, und wenn er mir die Größe des Steins nicht sagen kann (oder will), werde ich den Arzt wechseln.

In Teil b) ist klar, dass Sie die Preise für die Verfahren separat betrachten möchten, aber die Preise allein reichen nicht aus. Angenommen, der erste Arzt hat die schwierige Operation nur einmal mit einem erfolgreichen Ergebnis durchgeführt, und der zweite Arzt hat sie 37 Mal mit 35 Erfolgen durchgeführt. Ich wäre furchtbar geneigt, mit dem zweiten Arzt zu gehen, aber ich möchte wissen, wie 35 von 37 mit nationalen Normen verglichen werden und ob die beiden Fehler zu Beginn seiner Karriere (während er noch lernte) oder in jüngerer Zeit (während er noch lernte) auftraten. nachdem er anfing stark zu trinken).

Ist diese Art von Diskussion das, was die Probleme erfordern, oder wird eine trockenere Antwort erwartet? Wenn Sie das Glück haben, dass ein Ausbilder dies liest, wie würden Sie meine Antwort bewerten?

saulspatz
quelle

Antworten:

9

Lassen Sie mich zunächst sagen, dass ich Ihnen eine hervorragende Note geben würde, wenn ich Ihre Fragen benoten würde. Dies sind die einleitenden Fragen des Buches, sodass Sie immer noch nicht über alle Werkzeuge verfügen, um die Probleme zu durchdenken, aber Sie zeigen bereits, dass Sie wissen, dass Sie kausale Informationen berücksichtigen müssen, um sie zu beantworten.

Beachten Sie nun, dass Sie bei der Frage gefragt werden, ob Sie die aggregierten Daten oder die getrennten Daten anzeigen möchten. In beiden Fällen möchten Sie die getrennten Daten anzeigen.

In Frage A beeinflusst die Größe des Steins sowohl die Wahl der Behandlung als auch den Gesundheitszustand. Daher benötigen Sie die getrennten Daten, um diese Verzerrung zu beseitigen und festzustellen, welche Behandlung entweder bedingt oder bedingungslos wirksamer ist. Um zu wissen, welche Behandlung unbedingt besser ist, benötigen Sie die getrennten Daten, um den durchschnittlichen Kausaleffekt zu erhalten, gewichtet mit der Wahrscheinlichkeit der Steingröße , wobei Gesundheitszustand, die Wahl der Behandlung und die Steingröße ist. Wenn Sie wissen möchten, welche Behandlung bedingt besser ist, benötigen Sie natürlich auch die getrennte Tabelle. Y T SP.(Y.=1|dÖ(T.))=S.P.(Y.=1|T.,S.)P.(S.)P.(Y.=1|T.)Y.T.S.

Wenn es seltsam ist, eine Behandlung für sich selbst auszuwählen, ohne die Steingröße zu kennen, ist es möglicherweise einfacher, die analoge Frage zu verstehen, nur eine Behandlung für eine ganze Bevölkerung auswählen zu müssen (z. B. aus technischen / finanziellen Gründen, die Sie nicht auswählen können beide). In diesem Fall möchten Sie wissen, welches den größten durchschnittlichen Behandlungseffekt auf die Gesamtbevölkerung hat.

Frage B ist ein ähnliches Problem, die Schwierigkeit ist ein Störfaktor, daher benötigen Sie die getrennte Tabelle, um zu wissen, welcher Arzt sowohl bedingt als auch bedingungslos besser ist. Ihr Standpunkt zur Stichprobengröße ist vollständig gültig. Im wirklichen Leben sollten Sie immer die Stichprobenunsicherheit berücksichtigen. Beachten Sie jedoch, dass dies nichts an der Tatsache ändert, dass Sie weiterhin die Informationen der getrennten Daten benötigen würden.

In Bezug auf Ihren letzten Kommentar,

wenn die 2 Fehler zu Beginn seiner Karriere (während er noch lernte) oder in jüngerer Zeit (nachdem er angefangen hatte, stark zu trinken) auftraten.

Es berührt tatsächlich ein tiefes Problem der kausalen Folgerung, nämlich die Annahme der Invarianz . Nehmen Sie den Fall, in dem der Arzt gerade anfing, stark zu trinken. In diesem Fall stammen die Daten vor und nach diesem Ereignis nicht aus demselben Kausalmodell. Sie benötigen also tatsächlich mehr Informationen und mehr Kausalannahmen, um in diesem Fall Rückschlüsse zu ziehen.

Carlos Cinelli
quelle
2
Vielen Dank. Ihre Bemerkungen zum ersten Problem waren besonders klar.
Saulspatz
3

Ich habe Pearl's Causality , 2nd ed (2009) gelesen , aber nicht den Primer, auf den Sie sich hier beziehen. Sie scheinen diese Studienfragen mit genau der richtigen Mentalität anzugehen. Sie sammeln Ihr eigenes Hintergrundwissen, um diese Szenarien mit wesentlichen kausalen Informationen zu füllen . Sie greifen auch direkt an, was mir für die vorgestellten Entscheidungsprobleme ziemlich pervers erscheint , und versuchen, sie durch aussagekräftigere und realistischere Probleme zu ersetzen.

David C. Norris
quelle
2
+1 für den Ausdruck "ziemlich perverse Einbildungen". Natürlich sind Lehrbuchprobleme aus offensichtlichen Gründen nie ganz realistisch, aber mir war nicht klar, wie realistisch diese sein sollten. Ich denke, die Dinge werden klarer, wenn ich weiter lese.
Saulspatz