Konfidenzintervall und Wahrscheinlichkeit - wo liegt der Fehler in dieser Aussage?

11

Wenn jemand eine Erklärung wie folgt abgibt:

"Insgesamt hatten Nichtraucher, die Umweltrauch ausgesetzt waren, ein relatives Risiko für koronare Herzerkrankungen von 1,25 (95-Prozent-Konfidenzintervall, 1,17 bis 1,32) im Vergleich zu Nichtrauchern, die keinem Rauch ausgesetzt waren."

Was ist das relative Risiko für die Gesamtbevölkerung? Wie viele Dinge hängen mit einer koronaren Herzkrankheit zusammen? Von der großen Anzahl von Dingen, die getestet werden können, sind nur sehr wenige tatsächlich mit einer koronaren Herzkrankheit verbunden, so dass die Wahrscheinlichkeit, dass eine bestimmte zufällig ausgewählte Sache verbunden ist, verschwindend gering ist. Wir können also sagen, dass das relative Risiko für die Bevölkerung 1 beträgt. Das angegebene Intervall enthält jedoch nicht den Wert 1. Entweder besteht tatsächlich eine Verbindung zwischen den beiden Dingen, deren Wahrscheinlichkeit verschwindend gering ist, oder dies ist eines von die 5% der Intervalle, die den Parameter nicht enthalten. Da Letzteres weitaus wahrscheinlicher ist als Ersteres, sollten wir davon ausgehen. Die angemessene Schlussfolgerung ist daher, dass der Datensatz mit ziemlicher Sicherheit für die Bevölkerung untypisch war.

Wenn es eine Grundlage für die Annahme gibt, dass mehr als 5% der Dinge mit einer koronaren Herzkrankheit zusammenhängen, könnte die Statistik einige Hinweise enthalten, die den Vorschlag stützen, dass Umweltrauch einer von ihnen ist. Der gesunde Menschenverstand legt nahe, dass dies unwahrscheinlich ist.

Was ist der Fehler in ihrer Argumentation (da sich alle Gesundheitsorganisationen einig sind, dass es bedeutende Literatur zu den schädlichen Auswirkungen des Rauchens aus zweiter Hand gibt)? Liegt es an ihrer Prämisse, dass "von der Vielzahl der Dinge, die getestet werden können, nur sehr wenige tatsächlich mit einer koronaren Herzkrankheit verbunden sind"? Dieser Satz mag für jeden zufällig ausgewählten Faktor zutreffen (dh wie viele Hunde eine Person mit dem Risiko einer Erkrankung der Herzkranzgefäße besitzt), aber die Wahrscheinlichkeit von vornherein ist für das Rauchen aus zweiter Hand und die Erkrankung der Herzkranzgefäße viel höher als für „jeden zufälligen Faktor“. .

Ist das die richtige Argumentation? Oder gibt es noch etwas?

probability statistical-significance confidence-interval conditional-probability philosophical BYS2
quelle

Der zitierte Text scheint ... nun, wie ein Zitat. Wo kommt es her? :)

MånsT

haha ja es ist ein Zitat aus Wikipedia ... jemand hat dies dem Artikel für "Konfidenzintervall" hinzugefügt. Ich versuche es zu entfernen, weil das eindeutig falsch ist, aber der Typ lehnt ab, also brauche ich einen mathematisch fundierten Grund anstatt nur "das ist eindeutig falsch". Obwohl ich einige Ideen habe, wollte ich wissen, ob jemand erklären könnte genau welche Fehler hier gemacht werden. Denn wenn dies richtig wäre, könnten viele Studien aus ähnlichen Gründen widerlegt werden

BYS2

3

Wenn es sich etwas hinzieht, gehe ich rüber und versuche zu helfen. Sein Argument ist eindeutig trügerisch und deutet stark darauf hin, dass er eine Agenda hat.

Erik

3

Als Physiker, der viele Statistiken verwendet, aber kein Statistiker ist, finde ich diesen Absatz wirklich nicht hilfreich, egal, dass er einfach falsch klingt. Ich habe immer, möglicherweise fälschlicherweise, gedacht, dass ein 95% cl bedeutet, dass wenn die Nullhypothese wahr wäre, 1 Mal in 20, wenn ich mein Experiment wiederholte, ich ein signifikantes Ergebnis auf 95% -Niveau erhalten würde (ein guter Grund meiner Meinung nach dazu nicht weniger als 99,9 verwenden, aber das ist eine andere Diskussion). Dieser Beitrag scheint eher ein Punkt über korrelierte Faktoren zu sein und hilft Nicht-Experten (oder irgendjemandem) überhaupt nicht.

Bowler

@Erik. Der Benutzer hat eine ziemlich zwielichtige Geschichte mit Sockenpuppen (hatte ein paar Konten und verwendet IP-Änderungen) und wurde zuvor blockiert ... nicht sicher, was sein Geschäft ist. Aber scheint wie ein Unruhestifter

BYS2

10

Hier stimmt vieles nicht. Wie @ Néstor erklärt, geht er implizit von vorherigen Wahrscheinlichkeiten für (kein Link) und $H_0$ (Link) aus. $H_1$

Er legt ein sehr hohes Gewicht (sehr nahe an 1) auf und ein sehr kleines Gewicht auf . Dies ist die erste zweifelhafte Sache, die er tut, da es einen mechanistischen Zusammenhang zwischen Rauch und Herzerkrankungen gibt (betrachten Sie aktive Raucher), ist die Frage wirklich, ob die Exposition ausreicht. Dies berücksichtigt nicht einmal die zuvor durchgeführten Studien. Es gehört also wirklich nicht zu den "vielen Dingen", die getestet werden müssen, wie es beispielsweise das Tragen roter Socken wäre. Dies bedeutet, dass er bereits mit einem stark voreingenommenen und nicht wirklich vertretbaren Vorgänger beginnt. $H_0$ $H_1$

Anschließend aktualisiert er seinen Prior, indem er angibt, dass die Wahrscheinlichkeit, ein 95% -Konfidenzintervall zu erhalten, in dem der wahre Wert nicht enthalten ist, eine Wahrscheinlichkeit von 5% hat. Dies ist zwar wahr, aber dies ist nicht die Chance, dieses bestimmte Intervall unter der Annahme der Nullhypothese zu erhalten . Beachten Sie, dass er ein Konfidenzintervall von [1,17, 1,32] genauso behandelt hätte wie ein Konfidenzintervall von [100, 200], was eindeutig problematisch ist.

Dies ist für den Bayes'schen Ansatz wirklich wichtig: Während Sie eine Gesamtwahrscheinlichkeit von 5% haben, kein Intervall zu erhalten, das die 1 enthält, unter der Annahme, dass 1 Null ist, ist die Wahrscheinlichkeitsdichte, dieses bestimmte Intervall zu erhalten, unterschiedlich (und kleiner).

$H_0$ $H_1$

Der vierte Fehler besteht darin, zu sagen, dass die geeignete Maßnahme darin besteht, die Daten zu verwerfen. Beachten Sie, dass sein Ergebnis nicht einmal von den Daten abhängt. Sein Argument impliziert, dass für alle Daten genau dieselbe Aktion ausgeführt worden wäre. Wenn Sie einen interessanten Link finden, aber vermuten, dass es sich nur um einen Zufall handelt, sollten Sie versuchen, Ihr Ergebnis zu replizieren.

Erik
quelle

Vielen Dank, dass Sie die Antwort von Nestor erweitert haben! Bei einer kurzen Frage stellten Sie jedoch fest, dass "... dies nicht die Chance ist, dieses bestimmte Intervall unter der Annahme der Nullhypothese zu erhalten." Wenn wir die Chance finden wollten, ein bestimmtes Intervall unter der Annahme der Nullhypothese zu erhalten, müssten wir die Bayes'sche Inferenz verwenden und ein glaubwürdiges Intervall korrekt? Häufige Konfidenzintervalle geben nur an, "ob das Intervall den wahren Wert enthält".

Nochmals vielen

Das häufig auftretende Konfidenzintervall von 95% ist so konstruiert, dass mindestens 95% der Fälle, in denen das erstellte Intervall den wahren Wert enthält. So weit, ist es gut. Vor diesem Hintergrund können Sie auch die Wahrscheinlichkeit (oder den Wert der Dichte) berechnen, ein bestimmtes Konfidenzintervall zu erhalten, wenn die Nullhypothese wahr ist. Der genaue Ort enthält mehr "Informationen" als nur, ob er die Nullhypothese enthält. Das Wegwerfen dieser Informationen ist schlecht, wenn die Bayes'sche Inferenz verwendet wird, da sie für die Wahrscheinlichkeit relevant ist, dass die Null wahr ist.

Erik

Ein Spielzeugbeispiel wäre folgendes: Bayesianische Folgerung, Sie möchten Rückschlüsse auf die Form einer Verteilung ziehen. Prior erlaubt zwei Möglichkeiten: H1: Verteilung ist Standard normal. H2: Verteilung normal, Mittelwert = sd = 1. Mit einer Stichprobe der Werte der Verteilungen können Sie Ihren Prior aktualisieren. Wenn Sie nur die Zeichen Ihrer Werte erhalten, können Sie auch Ihre vorherigen aktualisieren. Die Aktualisierung ist jedoch weniger informativ, da Sie relevante Informationen weggeworfen haben.

Erik

6

Dies ist ein ziemlich interessantes philosophisches Thema im Zusammenhang mit dem Testen von Hypothesen (und damit im frequentistischen Umfeld auch Konfidenzintervalle, wie ich hier erläutere ).

Es gibt natürlich viele Hypothesen, die untersucht werden könnten - Passivrauchen verursacht koronare Herzkrankheiten, Alkoholkonsum verursacht chd, Hundebesitz verursacht chd, Steinbock verursacht chd ...

Wenn wir eine dieser Hypothesen zufällig auswählen, ist die Wahrscheinlichkeit, dass wir eine Hypothese wählen, die zufällig wahr ist, praktisch Null. Dies scheint das Argument im zitierten Text zu sein - dass es sehr unwahrscheinlich ist, dass wir zufällig eine wahre Hypothese getestet haben.

Die Hypothese wurde jedoch nicht zufällig ausgewählt.Es wurde durch frühere epidemiologische und medizinische Kenntnisse über koronare Herzkrankheiten motiviert. Es gibt theoretische Mechanismen, die erklären, wie Rauchen eine koronare Herzkrankheit verursachen kann. Es scheint also nicht weit hergeholt zu sein, zu glauben, dass diese auch beim Passivrauchen funktionieren würden.

Die Kritik im Zitat kann für explorative Studien gelten, bei denen ein Datensatz für Hypothesen ermittelt wird. Aus diesem Grund akzeptieren wir solche "Entdeckungen" nicht als Fakten. Stattdessen müssen die Ergebnisse in neuen Studien repliziert werden. In beiden Fällen handelt es sich bei dem im Zitat zitierten Artikel um eine Metastudie, die von diesem Problem nicht betroffen ist.

Wir haben in den letzten Jahrhunderten empirisch gesehen, dass das Testen theoretisch motivierter Hypothesen durch Vergleichen der vorhergesagten Ergebnisse mit den beobachteten Ergebnissen funktioniert. Die Tatsache, dass wir an dieses Verfahren glauben, ist der Grund, warum wir in Medizin, Technik und Wissenschaft so große Fortschritte gemacht haben. Dies ist der Grund, warum ich dies auf meinem Computer schreiben kann und dass Sie es auf Ihrem Computer lesen können. Zu argumentieren, dass dieses Verfahren falsch ist, bedeutet zu argumentieren, dass die wissenschaftliche Methode grundlegend fehlerhaft ist - und wir haben viele Beweise, die etwas anderes aussagen.

Ich bezweifle, dass es etwas gibt, das eine Person, die nicht bereit ist, diese Art von Beweisen zu akzeptieren, tatsächlich akzeptiert ...

MånsT
quelle

Ich habe Ihren Absatz wirklich nicht vor dem letzten bekommen; Beziehen Sie sich auf "Signifikanztests" (z. B. Berechnung der Wahrscheinlichkeit von Daten, die zumindest extremer sind) oder wirklich auf "Hypothesentests" (Bayes'sche Einstellung)? Wer hat gesagt, dass einer von ihnen nicht funktioniert, wenn Sie die richtige Frage stellen?

Néstor

@ Néstor: Ich hätte das vielleicht anders schreiben sollen. Ich habe nicht wirklich eine Aussage über das Testen statistischer Hypothesen gemacht, sondern eine Beobachtung darüber, dass der Vergleich von Modellvorhersagen mit realen Daten (dh "Testen", wenn die Hypothese korrekt ist) eine sehr effiziente Methode zu sein scheint Wissenschaft. Im Zentrum dieser Kritik an CIs steht meines Erachtens die mangelnde Bereitschaft, diese Methode zu akzeptieren. Die Art der Argumente im Zitat würde für jede statistische Methode gelten - mit null vorherigen Wahrscheinlichkeiten für alle Nullhypothesen würden wir niemals an etwas glauben.

MånsT

6

Ich verstehe wirklich nicht, warum der Autor sagt, dass die Wahrscheinlichkeit eines relativen Risikos für eine koronare Herzkrankheit 1 verschwindend gering sein könnte, wenn man seine Analyse ausschließlich auf ein Konfidenzintervall stützt; das ist einfach falsch. Für mich sieht es so aus, als würde er eine frequentistische Einstellung verwenden, aber er argumentiert bayesianisch (was ziemlich häufig ist).

Das einzige, was mit einem CI verbunden ist, sind klassische Signifikanztests, aber wie wir alle wissen, wenn $H_0:$ { Es gibt keinen Zusammenhang zwischen Rauchen aus zweiter Hand und koronarer Herzkrankheit }, geben sie Ihnen $p(D_e|H_0)$ (wo $D_e$ bezeichnet "Daten mindestens so extrem wie das, was wir beobachtet haben"), nicht $p(H_0|D)$ (wo $D$ sind die Daten), was er behauptet und was genau mit dem verknüpft ist, worauf Sie hinweisen; Sie müssen Vorkenntnisse über diesen bestimmten Link einfließen lassen! Dies kommt von der Tatsache, dass:

p ({H.}_{0} | D.) \propto p (D. | {H.}_{0}) p ({H.}_{0}),

$p(H_0|D)\propto p(D|H_0)p(H_0),$ von Bayes Theorem, wo

p (H_{0})

$p(H_0)$ ist die vorherige Wahrscheinlichkeit auf

H_{0}

$H_0$ .

Néstor
quelle

Wäre H0 nicht: Es gibt keinen Zusammenhang zwischen Passivrauchen und KHK? Da die Nullhypothese normalerweise die Hypothese ist, dass es keine Wirkung gibt. Abgesehen davon, danke für diese Antwort!

BYS2

Ja, du hast recht! Ich habe es nicht bemerkt, bis du darauf hingewiesen hast :-). Ich werde meine Antwort bearbeiten.

Néstor

3

Während diese Bayes'sche Argumentation (von Erik sehr gründlich dekonstruiert!) Etwas enthält und diese Denkrichtung tatsächlich erklären würde, warum viele medizinische Befunde nicht reproduziert werden können, gilt dieses spezielle Argument für das Denken wie ein Vorschlaghammer.

Der Autor setzt zwei Dinge voraus, ohne Beweise dafür zu liefern: dass die Exposition gegenüber Rauch zufällig ausgewählt wurde und dass fast nichts auf der Welt Herzkrankheiten verursacht. Unter diesen laxen Argumentationsstandards könnte der Autor JEDE Schlussfolgerung ablehnen, dass etwas Herzkrankheiten verursacht. Alles, was Sie tun müssten, ist zu behaupten:

Dass die Hypothese zufällig gewählt wurde, und
Diese Herzkrankheit hat sehr nahe Null Ursachen.

Beide Behauptungen sind umstritten (und nach meinem Allgemeinwissen sehr wahrscheinlich falsch). Aber mit diesen Annahmen könnte man behaupten, dass die Verbindung nur eine zufällige Korrelation mit der verborgenen, singulären, "wahren" Ursache ist, selbst wenn man beobachtet, dass 100% der Menschen, die Passivrauch ausgesetzt sind, innerhalb eines Jahres an einem Herzinfarkt gestorben sind .

Jonathan
quelle

Okay, danke für deine Gedanken! Ja, der Autor ging definitiv davon aus, dass die Hypothese „zufällig ausgewählt“ wurde, was nicht korrekt ist.

BYS2

-1

Ich sehe offensichtlich nichts Falsches an dem Absatz in Zitaten, aber ich habe die Daten nicht gesehen und kann die Zahlen nicht überprüfen. Die beiden folgenden Absätze sind jedoch sehr unklar.

Angenommen, er hätte gesagt: "Insgesamt hatten Nichtraucher, die krankhaft fettleibig waren, ein relatives Risiko für eine koronare Herzkrankheit von 1,25 (95-Prozent-Konfidenzintervall, 1,17 bis 1,32) im Vergleich zu Nichtrauchern mit normalem Körpergewicht." Hätte jemand Grund, an ihm zu zweifeln?

Emil Friedman
quelle

Nun, der erste Absatz in Zitaten war nur der Autor, der die Schlussfolgerungen einer epidemiologischen Studie zitierte, so dass daran nichts auszusetzen ist. In den nächsten Absätzen versucht er, die Studie zu diskreditieren, in der er einige zweifelhafte Aussagen macht.

BYS2

Konfidenzintervall und Wahrscheinlichkeit - wo liegt der Fehler in dieser Aussage?

Antworten: