Ich habe widersprüchliche Informationen zu der Frage gefunden: " Wenn man ein 95% -Konfidenzintervall (CI) aus einer Differenz der Mittelwerte oder einer Differenz der Anteile erstellt, sind alle Werte innerhalb des CI gleich wahrscheinlich? Oder ist die Punktschätzung die wahrscheinlichste mit Werten in der Nähe der "Schwänze" des CI weniger wahrscheinlich als in der Mitte des CI?
Wenn zum Beispiel ein randomisierter klinischer Studienbericht besagt, dass das relative Mortalitätsrisiko bei einer bestimmten Behandlung 1,06 beträgt (95% CI 0,96 bis 1,18), ist die Wahrscheinlichkeit, dass 0,96 der richtige Wert ist, die gleiche wie 1,06?
Ich habe online viele Hinweise auf dieses Konzept gefunden, aber die folgenden beiden Beispiele spiegeln die darin enthaltene Unsicherheit wider:
Lisa Sullivans Modul über Konfidenzintervalle lautet:
Die Konfidenzintervalle für die liefern einen Bereich wahrscheinlicher Werte für ( ). Es ist wichtig zu beachten, dass alle Werte im Konfidenzintervall gleich wahrscheinlich Schätzungen des wahren Werts von ( ) sind.
Dieser Blogpost mit dem Titel Within the Margin of Error lautet:
Was ich im Sinn habe, ist ein Missverständnis über die „Fehlerquote“, die alle Punkte innerhalb des Konfidenzintervalls gleich wahrscheinlich behandelt, als ob der zentrale Grenzwertsatz eine begrenzte Gleichverteilung anstelle einer t- Verteilung impliziert . [...]
Das, was über "Fehlertoleranz" spricht, ist, dass Möglichkeiten, die nahe an der Punktschätzung liegen, viel wahrscheinlicher sind als Möglichkeiten, die am Rande der Grenze liegen ".
Diese scheinen widersprüchlich, also was ist richtig?
quelle
Antworten:
Eine Frage, die beantwortet werden muss, ist, was "wahrscheinlich" in diesem Zusammenhang bedeutet.
Wenn es sich um eine Wahrscheinlichkeit handelt (wie es manchmal als Synonym für verwendet wird) und wir strenge frequentistische Definitionen verwenden, dann ist der wahre Parameterwert ein einzelner Wert, der sich nicht ändert, sodass die Wahrscheinlichkeit (Wahrscheinlichkeit) für diesen Punkt 100% und alles ist andere Werte sind 0%. So sind fast alle gleich wahrscheinlich bei 0%, aber wenn das Intervall den wahren Wert enthält, dann ist es anders als die anderen.
Wenn wir einen Bayes'schen Ansatz verwenden, stammt das CI (Credible Interval) aus der posterioren Verteilung und Sie können die Wahrscheinlichkeit an den verschiedenen Punkten innerhalb des Intervalls vergleichen. Wenn der hintere Teil innerhalb des Intervalls nicht vollkommen gleichmäßig ist (theoretisch möglich, aber das wäre ein merkwürdiger Umstand), haben die Werte unterschiedliche Wahrscheinlichkeiten.
Wenn es wahrscheinlich ähnlich aussieht wie das Konfidenzintervall, gehen Sie folgendermaßen vor: Berechnen Sie ein Konfidenzintervall von 95%, ein Konfidenzintervall von 90% und ein Konfidenzintervall von 85%. Wir wären zu 5% zuversichtlich, dass der wahre Wert in der Region innerhalb des 95% -Intervalls liegt, aber außerhalb des 90% -Intervalls können wir sagen, dass der wahre Wert mit einer Wahrscheinlichkeit von 5% in diese Region fällt. Gleiches gilt für die Region innerhalb des 90% -Intervalls, jedoch außerhalb des 85% -Intervalls. Wenn also jeder Wert gleich wahrscheinlich ist, müsste die Größe der beiden oben genannten Bereiche exakt gleich sein, und dies gilt auch für den Bereich innerhalb eines Konfidenzintervalls von 10%, jedoch außerhalb eines Konfidenzintervalls von 5%. Keine der Standardverteilungen, mit denen Intervalle erstellt werden, hat diese Eigenschaft (mit Ausnahme von Sonderfällen, bei denen 1 aus einer Uniform stammt).
Sie können dies auch selbst beweisen, indem Sie eine große Anzahl von Datensätzen aus bekannten Populationen simulieren, das interessierende Konfidenzintervall berechnen und dann vergleichen, wie oft der wahre Parameter näher an der Punktschätzung liegt als an jedem der Endpunkte.
quelle
Das ist eine tolle Frage! Es gibt ein mathematisches Konzept namens Likelihood, das Ihnen hilft, die Probleme zu verstehen. Fisher erfand die Wahrscheinlichkeit, hielt sie jedoch für etwas weniger wünschenswert als die Wahrscheinlichkeit, aber die Wahrscheinlichkeit erwies sich als "primitiver" als die Wahrscheinlichkeit, und Ian Hacking (1965) betrachtete sie als axiomatisch, da sie nicht nachweisbar ist. Die Wahrscheinlichkeit untermauert eher die Wahrscheinlichkeit als das Gegenteil.
Hacking, 1965. Logik der statistischen Inferenz .
Der Wahrscheinlichkeit wird nicht die Aufmerksamkeit geschenkt, die sie in Standardlehrbüchern der Statistik haben sollte, und zwar ohne guten Grund. Es unterscheidet sich von der Wahrscheinlichkeit darin, dass es fast genau die Eigenschaften aufweist, die man erwarten würde, und Wahrscheinlichkeitsfunktionen und -intervalle sind sehr nützlich für die Schlussfolgerung. Vielleicht wird die Wahrscheinlichkeit von einigen Statistikern nicht gemocht, weil es manchmal keinen "richtigen" Weg gibt, die relevanten Wahrscheinlichkeitsfunktionen abzuleiten. In vielen Fällen sind die Wahrscheinlichkeitsfunktionen jedoch offensichtlich und klar definiert. Eine Untersuchung der Inferenzwahrscheinlichkeiten sollte wahrscheinlich mit Richard Royalls kleinem und leicht verständlichem Buch " Statistical Evidence: a Likelihood Paradigm" beginnen .
Die Antwort auf Ihre Frage lautet: Nein, die Punkte in einem Intervall haben nicht alle die gleiche Wahrscheinlichkeit. Diejenigen an den Rändern eines Konfidenzintervalls haben gewöhnlich geringere Wahrscheinlichkeiten als andere in Richtung der Mitte des Intervalls. Das herkömmliche Konfidenzintervall sagt natürlich nichts direkt über den für das jeweilige Experiment relevanten Parameter aus. Die Konfidenzintervalle von Neyman sind "global", da sie eher langfristige Eigenschaften aufweisen als "lokale" Eigenschaften, die für das vorliegende Experiment relevant sind. (Glücklicherweise kann eine gute Langzeitleistung auf lokaler Ebene interpretiert werden, dies ist jedoch eher eine intellektuelle Abkürzung als eine mathematische Realität.) Wahrscheinlichkeitsintervalle - in den Fällen, in denen sie konstruiert werden können - spiegeln direkt die Wahrscheinlichkeit wider, mit der das vorliegende Experiment in Beziehung steht.
quelle
Angenommen, jemand hat mir gesagt, ich sollte allen Werten innerhalb eines CI95 als potenziellen Indikatoren für den Bevölkerungswert gleiches Vertrauen schenken. (Ich vermeide bewusst die Begriffe "wahrscheinlich" und "wahrscheinlich".) Was ist das Besondere an 95? Nichts: Um konsequent zu sein, müsste ich auch allen Werten innerhalb eines CI96, eines CI97, ... und eines CI99.9999999 gleiches Vertrauen schenken. Da sich die Reichweite des CI seinem Limit näherte, müssten praktisch alle reellen Zahlen einbezogen werden. Die Unsinnigkeit dieser Schlussfolgerung würde mich veranlassen, die ursprüngliche Behauptung zurückzuweisen.
quelle
Beginnen wir mit der Definition eines Konfidenzintervalls. Wenn ich sage, dass ein Konfidenzintervall von 95% von diesem Intervall bis zu diesem Intervall reicht, meine ich, dass Aussagen dieser Art in 95% der Fälle wahr und in 5% der Fälle falsch sind. Ich meine nicht unbedingt, dass ich zu 95% von dieser Aussage überzeugt bin . Ein Konfidenzintervall von 90% wird enger und ein Konfidenzintervall von 80% noch enger. Wenn ich mich frage, was der wahre Wert ist, habe ich weniger Vertrauen in Werte, wenn sie näher und näher an den Rand eines bestimmten Konfidenzintervalls rücken.
Beachten Sie, dass alles oben Genannte qualitativ ist, insbesondere "Glaubwürdigkeit". (Ich habe den Begriff "Vertrauen" oder "Wahrscheinlichkeit" in dieser Aussage vermieden, weil sie mathematisches Gepäck enthalten, das sich von unserem intuitiven Gepäck unterscheiden kann.) Bayesianische Ansätze würden Ihre Frage auf etwas umformulieren, das eine quantitative Antwort hat, die ich aber nicht öffnen möchte das kann von Würmern hier.
Der klassische Text von Box, Hunter & Hunter ("Statistics for Experimenters", Wiley, 1978) könnte ebenfalls hilfreich sein. Siehe "Sätze von Konfidenzintervallen" auf S. 113 ff.
quelle