Betrachten Sie ein Modell mit einem interessierenden Parameter. und sein Punktschätzer, . Nehmen Sie der Einfachheit halber an (In zahlreichen Fällen könnte dies asymptotisch gerechtfertigt sein). Es gibt zwei Möglichkeiten, ein Intervall zu erstellen, das so kurz wie möglich ist Level-Konfidenzintervall.
Für jeden wahren Wert Ich möchte das kürzestmögliche Intervall das hat Wahrscheinlichkeit der Erfassung . Ich wähle den Bereich mit der höchsten Dichte in der Verteilung von gegeben , , so dass die kumulative Wahrscheinlichkeit für diese Region ist . Ich definiere den Intervallschätzer so, dass für jede Punktschätzung in der Region würde die entsprechende Intervallschätzung abdecken .
Seit der Verteilung von ist für jeden wahren Wert gleich Mit Ausnahme einer Ortsverschiebung ist der Mechanismus (die Regel) zum Erstellen des Intervalls unabhängig von der tatsächlichen ist. Daher wird es alle wahren abdecken mit Wahrscheinlichkeit.Gegeben eine Punktschätzung Ich überlege, unter welchem wahren Wert es ist wahrscheinlich generiert worden. Kenntnis der Verteilung von für jeden gegebenen wahr , Ich wähle diese aus s, die die höchsten Dichtewerte ergeben. Ich beschränke die Auswahl auf nur
Werte das hat die kumulative Wahrscheinlichkeit für Werte mindestens so extrem wie ;; mit anderen Worten, dieWerte für die die entsprechenden -Wert verbunden mit ist mindestens .
Der erste Ansatz konzentriert sich direkt darauf, sicherzustellen, dass alles wahr ist ist es enthalten in Anteil der Stichprobeninstanzen. Der zweite Ansatz sucht den besten Kandidatens, die die Realisierung machen wahrscheinlich beim Verwerfen s unter denen ist unwahrscheinlich. Die Linie zwischen den beiden (wahrscheinlich vs. unwahrscheinlich) wird aus der Perspektive des ursprünglichen Ziels etwas willkürlich gezogen, aber es ist zufällig die richtige Linie.
Die beiden Regeln zum Erstellen eines Intervalls geben in diesem vereinfachten Beispiel dieselbe Antwort.
Welches (wenn eines der beiden) ist die richtige Motivation oder die richtige Art, über die Konstruktion eines Konfidenzintervalls nachzudenken?
(Vielleicht entfernen Sie die Verteilungsannahme für oben würde einen der Ansätze ungültig machen und klarstellen, dass er im Allgemeinen unangemessen ist und in diesem Beispiel nur zufällig die richtige Antwort gibt?)
quelle
Antworten:
Beispiel mit 100 Bernoulli-Versuchen
Die Konstruktion von Konfidenzintervallen könnte in einem Diagramm von platziert werdenθ gegen θ^ wie hier:
Können wir eine Nullhypothese mit Konfidenzintervallen ablehnen, die durch Stichproben anstelle der Nullhypothese erstellt wurden?
In meiner Antwort auf diese Frage verwende ich die folgende Grafik:
Beachten Sie, dass dieses Bild ein Klassiker und eine Adaption von The Use of Confidence oder Fiducial Limits ist, die im Fall des Binomial CJ Clopper und ES Pearson Biometrika Vol. 2 dargestellt sind. 26, Nr. 4 (Dezember 1934), S. 404-413
Sie könnten eine definierenα -% Vertrauensbereich auf zwei Arten:
in vertikaler RichtungL(θ)<X<U(θ) die Wahrscheinlichkeit für die Daten X , abhängig davon, ob der Parameter wirklich ist θ , innerhalb dieser Grenzen zu fallen ist α .
in horizontaler RichtungL(X)<θ<U(X) Die Wahrscheinlichkeit, dass ein Experiment den wahren Parameter innerhalb des Konfidenzintervalls hat, ist α %.
Korrespondenz zwischen zwei Richtungen
Der entscheidende Punkt ist also, dass zwischen den Intervallen eine Entsprechung bestehtL(X),U(X) und die Intervalle L(θ),U(θ) . Hierher kommen die beiden Methoden.
Wann du willstL(X) und U(X) so nah wie möglich sein ( "so schnell wie möglich (1−α ) Level Confidence Intervall " ) Dann versuchen Sie, den Bereich der gesamten Region so klein wie möglich zu machen, und dies ähnelt dem AbrufenL(θ) und U(θ) so nah wie möglich. (Mehr oder weniger gibt es keine eindeutige Möglichkeit, das kürzestmögliche Intervall zu erhalten, z. B. können Sie das Intervall für eine Art von Beobachtung verkürzenθ^ auf Kosten einer anderen Art der Beobachtung θ^ )
Beispiel mitθ^∼N(μ=θ,σ2=1+θ2/3)
Um die Differenz zwischen dem ersten und dem zweiten Verfahren veranschaulichen wir justieren Sie das Beispiel ein wenig , so dass wir einen Fall, wo die beiden Methoden nicht unterscheiden.
Das nicht konstant, sondern habe eine Beziehung zuσ μ=θ θ^∼N(μ=θ,σ2=1+θ2/3)
die Wahrscheinlichkeitsdichtefunktion für die dann , abhängig heißtθ^ θ f(θ^,θ)=12π(1+θ2/3)−−−−−−−−−−√exp[−(θ−θ^)22(1+θ2/3)]
Stellen Sie sich diese Wahrscheinlichkeitsdichtefunktion die als Funktion von und aufgetragen ist .f(θ^,θ) θ θ^
Legende: Die rote Linie ist die obere Grenze für das Konfidenzintervall und die grüne Linie ist die untere Grenze für das Konfidenzintervall. Das Konfidenzintervall wird für (ungefähr 68,3%) gezeichnet . Die dicken schwarzen Linien sind die PDF- (2-fache) und Wahrscheinlichkeitsfunktion, die sich in den Punkten und kreuzen. .±1σ (θ,θ^)=(−3,−1) (θ,θ^)=(0,−1)
PDF In der Richtung von links nach rechts (konstant ) haben wir die pdf für die Beobachtung gegeben . Sie sehen zwei davon projiziert (in der Ebene ). Beachten Sie, dass die Werte-Grenzen ( als Bereich mit der höchsten Dichte ausgewählt) für ein einzelnes PDF auf derselben Höhe liegen, für verschiedene PDF-Dateien jedoch nicht auf derselben Höhe (nach Höhe bedeutet dies den Wert) von )θ θ^ θ θ=7 p p<1−α f(θ^,θ)
Likelihood - Funktion in der Richtung von oben nach unten (constant ) haben wir die Likelihood - Funktion für angesichts der Beobachtung . Sie sehen eine davon rechts projiziert.θ^ θ θ^
Wenn Sie in diesem speziellen Fall die 68% -Masse mit der höchsten Dichte für konstantes auswählen, erhalten Sie nicht das Gleiche wie die Auswahl der 68% -Masse mit der höchsten Wahrscheinlichkeit für konstantes .θ θ^
Für andere Prozentsätze des Konfidenzintervalls haben Sie eine oder beide Grenzen bei und das Intervall kann auch aus zwei disjunkten Teilen bestehen. Hier liegt also offensichtlich nicht die höchste Dichte der Wahrscheinlichkeitsfunktion (Methode 2). Dies ist ein eher künstliches Beispiel (obwohl es einfach und schön ist, wie es zu diesen vielen Details führt), aber auch für häufigere Fälle kann man leicht feststellen, dass die beiden Methoden nicht zusammenfallen (siehe das Beispiel hier, in dem das Konfidenzintervall und das glaubwürdige Intervall vorliegen mit einem flachen Prior werden für den Ratenparameter einer Exponentialverteilung verglichen).±∞
Wann sind die beiden Methoden gleich?
Diese Horizontale gegen Vertikale ergibt das gleiche Ergebnis, wenn die Grenzen und , die die Intervalle in der Darstellung vs Isolinien für . Wenn sich die Grenzen überall auf derselben Höhe befinden wie in keiner der beiden Richtungen, können Sie eine Verbesserung vornehmen.U L θ θ^ f(θ^;θ)
(im Gegensatz dazu: Im Beispiel mit die Konfidenzintervallgrenzen nicht den gleichen Wert für verschiedene , weil die Wahrscheinlichkeitsmasse für größere stärker verteilt wird, also eine geringere Dichte . Dies führt dazu, dass und nicht an der liegen gleicher Wert , zumindest für einige . Dies widerspricht Methode 2, die versucht, die höchsten Dichten für ein gegebenes auszuwählenθ^∼N(θ,1+θ2/3) f(θ^,θ) θ |θ| θlow θhigh f(θ^;θ) θ^ f(θ^;θ) θ^ . Im obigen Bild habe ich versucht, dies zu betonen, indem ich die beiden PDF-Funktionen, die sich auf die Konfidenzintervallgrenzen beziehen, auf den Wert . Sie können sehen, dass sie an diesen Grenzen unterschiedliche Werte des PDF haben.) θ^=−1
Tatsächlich scheint die zweite Methode nicht ganz richtig zu sein (es ist eher eine Art Variante eines Wahrscheinlichkeitsintervalls oder eines glaubwürdigen Intervalls als eines Konfidenzintervalls) und wenn Sie % Dichte in horizontaler Richtung auswählen (Begrenzung % der Masse der Wahrscheinlichkeitsfunktion), dann können Sie von den vorherigen Wahrscheinlichkeiten abhängig sein .α α
Im Beispiel mit der Normalverteilung ist dies kein Problem und die beiden Methoden stimmen überein. Zur Veranschaulichung siehe auch diese Antwort von Christoph Hanck . Dort sind die Grenzen Isolinien. Wenn Sie das ändern, verschiebt sich die Funktion nur und ändert nicht die 'Form'.θ f(θ^,θ)
Bezugswahrscheinlichkeit
Das Konfidenzintervall, wenn die Grenzen in vertikaler Richtung erstellt werden, ist unabhängig von den vorherigen Wahrscheinlichkeiten. Dies ist bei der 2. Methode nicht der Fall.
Dieser Unterschied zwischen der ersten und der zweiten Methode kann ein gutes Beispiel für den subtilen Unterschied zwischen Bezugswahrscheinlichkeit und Konfidenzintervallen sein.
quelle