Wenn jemand eine Erklärung wie folgt abgibt:
"Insgesamt hatten Nichtraucher, die Umweltrauch ausgesetzt waren, ein relatives Risiko für koronare Herzerkrankungen von 1,25 (95-Prozent-Konfidenzintervall, 1,17 bis 1,32) im Vergleich zu Nichtrauchern, die keinem Rauch ausgesetzt waren."
Was ist das relative Risiko für die Gesamtbevölkerung? Wie viele Dinge hängen mit einer koronaren Herzkrankheit zusammen? Von der großen Anzahl von Dingen, die getestet werden können, sind nur sehr wenige tatsächlich mit einer koronaren Herzkrankheit verbunden, so dass die Wahrscheinlichkeit, dass eine bestimmte zufällig ausgewählte Sache verbunden ist, verschwindend gering ist. Wir können also sagen, dass das relative Risiko für die Bevölkerung 1 beträgt. Das angegebene Intervall enthält jedoch nicht den Wert 1. Entweder besteht tatsächlich eine Verbindung zwischen den beiden Dingen, deren Wahrscheinlichkeit verschwindend gering ist, oder dies ist eines von die 5% der Intervalle, die den Parameter nicht enthalten. Da Letzteres weitaus wahrscheinlicher ist als Ersteres, sollten wir davon ausgehen. Die angemessene Schlussfolgerung ist daher, dass der Datensatz mit ziemlicher Sicherheit für die Bevölkerung untypisch war.
Wenn es eine Grundlage für die Annahme gibt, dass mehr als 5% der Dinge mit einer koronaren Herzkrankheit zusammenhängen, könnte die Statistik einige Hinweise enthalten, die den Vorschlag stützen, dass Umweltrauch einer von ihnen ist. Der gesunde Menschenverstand legt nahe, dass dies unwahrscheinlich ist.
Was ist der Fehler in ihrer Argumentation (da sich alle Gesundheitsorganisationen einig sind, dass es bedeutende Literatur zu den schädlichen Auswirkungen des Rauchens aus zweiter Hand gibt)? Liegt es an ihrer Prämisse, dass "von der Vielzahl der Dinge, die getestet werden können, nur sehr wenige tatsächlich mit einer koronaren Herzkrankheit verbunden sind"? Dieser Satz mag für jeden zufällig ausgewählten Faktor zutreffen (dh wie viele Hunde eine Person mit dem Risiko einer Erkrankung der Herzkranzgefäße besitzt), aber die Wahrscheinlichkeit von vornherein ist für das Rauchen aus zweiter Hand und die Erkrankung der Herzkranzgefäße viel höher als für „jeden zufälligen Faktor“. .
Ist das die richtige Argumentation? Oder gibt es noch etwas?
quelle
Antworten:
Hier stimmt vieles nicht. Wie @ Néstor erklärt, geht er implizit von vorherigen Wahrscheinlichkeiten für (kein Link) und H ausH.0 (Link) aus.H.1
Er legt ein sehr hohes Gewicht (sehr nahe an 1) auf und ein sehr kleines Gewicht auf H 1 . Dies ist die erste zweifelhafte Sache, die er tut, da es einen mechanistischen Zusammenhang zwischen Rauch und Herzerkrankungen gibt (betrachten Sie aktive Raucher), ist die Frage wirklich, ob die Exposition ausreicht. Dies berücksichtigt nicht einmal die zuvor durchgeführten Studien. Es gehört also wirklich nicht zu den "vielen Dingen", die getestet werden müssen, wie es beispielsweise das Tragen roter Socken wäre. Dies bedeutet, dass er bereits mit einem stark voreingenommenen und nicht wirklich vertretbaren Vorgänger beginnt.H.0 H.1
Anschließend aktualisiert er seinen Prior, indem er angibt, dass die Wahrscheinlichkeit, ein 95% -Konfidenzintervall zu erhalten, in dem der wahre Wert nicht enthalten ist, eine Wahrscheinlichkeit von 5% hat. Dies ist zwar wahr, aber dies ist nicht die Chance, dieses bestimmte Intervall unter der Annahme der Nullhypothese zu erhalten . Beachten Sie, dass er ein Konfidenzintervall von [1,17, 1,32] genauso behandelt hätte wie ein Konfidenzintervall von [100, 200], was eindeutig problematisch ist.
Dies ist für den Bayes'schen Ansatz wirklich wichtig: Während Sie eine Gesamtwahrscheinlichkeit von 5% haben, kein Intervall zu erhalten, das die 1 enthält, unter der Annahme, dass 1 Null ist, ist die Wahrscheinlichkeitsdichte, dieses bestimmte Intervall zu erhalten, unterschiedlich (und kleiner).
Der vierte Fehler besteht darin, zu sagen, dass die geeignete Maßnahme darin besteht, die Daten zu verwerfen. Beachten Sie, dass sein Ergebnis nicht einmal von den Daten abhängt. Sein Argument impliziert, dass für alle Daten genau dieselbe Aktion ausgeführt worden wäre. Wenn Sie einen interessanten Link finden, aber vermuten, dass es sich nur um einen Zufall handelt, sollten Sie versuchen, Ihr Ergebnis zu replizieren.
quelle
Dies ist ein ziemlich interessantes philosophisches Thema im Zusammenhang mit dem Testen von Hypothesen (und damit im frequentistischen Umfeld auch Konfidenzintervalle, wie ich hier erläutere ).
Es gibt natürlich viele Hypothesen, die untersucht werden könnten - Passivrauchen verursacht koronare Herzkrankheiten, Alkoholkonsum verursacht chd, Hundebesitz verursacht chd, Steinbock verursacht chd ...
Wenn wir eine dieser Hypothesen zufällig auswählen, ist die Wahrscheinlichkeit, dass wir eine Hypothese wählen, die zufällig wahr ist, praktisch Null. Dies scheint das Argument im zitierten Text zu sein - dass es sehr unwahrscheinlich ist, dass wir zufällig eine wahre Hypothese getestet haben.
Die Hypothese wurde jedoch nicht zufällig ausgewählt.Es wurde durch frühere epidemiologische und medizinische Kenntnisse über koronare Herzkrankheiten motiviert. Es gibt theoretische Mechanismen, die erklären, wie Rauchen eine koronare Herzkrankheit verursachen kann. Es scheint also nicht weit hergeholt zu sein, zu glauben, dass diese auch beim Passivrauchen funktionieren würden.
Die Kritik im Zitat kann für explorative Studien gelten, bei denen ein Datensatz für Hypothesen ermittelt wird. Aus diesem Grund akzeptieren wir solche "Entdeckungen" nicht als Fakten. Stattdessen müssen die Ergebnisse in neuen Studien repliziert werden. In beiden Fällen handelt es sich bei dem im Zitat zitierten Artikel um eine Metastudie, die von diesem Problem nicht betroffen ist.
Wir haben in den letzten Jahrhunderten empirisch gesehen, dass das Testen theoretisch motivierter Hypothesen durch Vergleichen der vorhergesagten Ergebnisse mit den beobachteten Ergebnissen funktioniert. Die Tatsache, dass wir an dieses Verfahren glauben, ist der Grund, warum wir in Medizin, Technik und Wissenschaft so große Fortschritte gemacht haben. Dies ist der Grund, warum ich dies auf meinem Computer schreiben kann und dass Sie es auf Ihrem Computer lesen können. Zu argumentieren, dass dieses Verfahren falsch ist, bedeutet zu argumentieren, dass die wissenschaftliche Methode grundlegend fehlerhaft ist - und wir haben viele Beweise, die etwas anderes aussagen.
Ich bezweifle, dass es etwas gibt, das eine Person, die nicht bereit ist, diese Art von Beweisen zu akzeptieren, tatsächlich akzeptiert ...
quelle
Ich verstehe wirklich nicht, warum der Autor sagt, dass die Wahrscheinlichkeit eines relativen Risikos für eine koronare Herzkrankheit 1 verschwindend gering sein könnte, wenn man seine Analyse ausschließlich auf ein Konfidenzintervall stützt; das ist einfach falsch. Für mich sieht es so aus, als würde er eine frequentistische Einstellung verwenden, aber er argumentiert bayesianisch (was ziemlich häufig ist).
Das einzige, was mit einem CI verbunden ist, sind klassische Signifikanztests, aber wie wir alle wissen, wennH.0:: { Es gibt keinen Zusammenhang zwischen Rauchen aus zweiter Hand und koronarer Herzkrankheit }, geben sie Ihnenp ( D.e| H.0) (wo D.e bezeichnet "Daten mindestens so extrem wie das, was wir beobachtet haben"), nicht p ( H.0| D) (wo D. sind die Daten), was er behauptet und was genau mit dem verknüpft ist, worauf Sie hinweisen; Sie müssen Vorkenntnisse über diesen bestimmten Link einfließen lassen! Dies kommt von der Tatsache, dass:
quelle
Während diese Bayes'sche Argumentation (von Erik sehr gründlich dekonstruiert!) Etwas enthält und diese Denkrichtung tatsächlich erklären würde, warum viele medizinische Befunde nicht reproduziert werden können, gilt dieses spezielle Argument für das Denken wie ein Vorschlaghammer.
Der Autor setzt zwei Dinge voraus, ohne Beweise dafür zu liefern: dass die Exposition gegenüber Rauch zufällig ausgewählt wurde und dass fast nichts auf der Welt Herzkrankheiten verursacht. Unter diesen laxen Argumentationsstandards könnte der Autor JEDE Schlussfolgerung ablehnen, dass etwas Herzkrankheiten verursacht. Alles, was Sie tun müssten, ist zu behaupten:
Beide Behauptungen sind umstritten (und nach meinem Allgemeinwissen sehr wahrscheinlich falsch). Aber mit diesen Annahmen könnte man behaupten, dass die Verbindung nur eine zufällige Korrelation mit der verborgenen, singulären, "wahren" Ursache ist, selbst wenn man beobachtet, dass 100% der Menschen, die Passivrauch ausgesetzt sind, innerhalb eines Jahres an einem Herzinfarkt gestorben sind .
quelle
Ich sehe offensichtlich nichts Falsches an dem Absatz in Zitaten, aber ich habe die Daten nicht gesehen und kann die Zahlen nicht überprüfen. Die beiden folgenden Absätze sind jedoch sehr unklar.
Angenommen, er hätte gesagt: "Insgesamt hatten Nichtraucher, die krankhaft fettleibig waren, ein relatives Risiko für eine koronare Herzkrankheit von 1,25 (95-Prozent-Konfidenzintervall, 1,17 bis 1,32) im Vergleich zu Nichtrauchern mit normalem Körpergewicht." Hätte jemand Grund, an ihm zu zweifeln?
quelle