Konfidenzintervall für Varianz bei einer Beobachtung

25

Dies ist ein Problem der "7. Kolmogorov-Studentenolympiade in der Wahrscheinlichkeitstheorie":

Geben Sie bei einer Beobachtung X aus einer Normal(μ,σ2) mit beiden unbekannten Parametern ein Konfidenzintervall für σ2 mit einem Konfidenzniveau von mindestens 99% an.

Es scheint mir, dass dies unmöglich sein sollte. Ich habe die Lösung, aber noch nicht gelesen. Irgendwelche Gedanken?

Ich werde die Lösung in ein paar Tagen veröffentlichen.

[Nachbearbeitung: Offizielle Lösung siehe unten. Die Lösung von Cardinal ist länger, bietet jedoch ein besseres Konfidenzintervall. Danke auch an Max und Glen_b für ihren Input.]

Jonathan Christensen
quelle
1
Scheint mir auch unmöglich; Ich warte auf die Antwort
Peter Flom - Monica wieder einsetzen
1
Schauen Sie sich diese Seite an .
Angenommen,
3
Hier ist ein Papier mit einer besseren Formatierung: Papier .
Angenommen,
Heh. Ich erinnere mich, vor vielen Jahren eine Zeitung über dieses Zeug gelesen zu haben (ein Beobachtungsintervall). Könnte dieser gewesen sein .
Glen_b
1
@Max, danke für den Link! Ich hatte noch keine Zeit, es mir genauer anzusehen, aber ich werde es tun. Ich habe die "offizielle" Antwort unten gepostet.
Jonathan Christensen

Antworten:

17

Unter Berücksichtigung von Wahrscheinlichkeitsungleichheiten und Zusammenhängen mit dem Mehrfachbeobachtungsfall erscheint dieses Ergebnis möglicherweise nicht so unmöglich oder zumindest plausibler.

Lassen Sie mit und unbekannt. Wir können für schreiben .μ 2 X = σ Z + μ Z N ( 0 , 1 )XN(μ,σ2)μσ2X=σZ+μZN(0,1)

Hauptanspruch : ist ein -Konfidenzintervall für wobei das Quantil einer Chi-Quadrat-Verteilung mit einem Grad von ist Freiheit. Da darüber hinaus dieses Intervall hat genau Abdeckung , wenn , ist es möglich , der schmalste Abstand von der Form für einig .( 1 - α ) σ 2 q α α ( 1 - α ) μ = 0 [ 0 , b X 2 ) b R[0,X2/qα)(1α)σ2qαα (1α)μ=0[0,bX2)bR

Grund zum Optimismus

Recall , dass in dem Fall mit , der typischen Konfidenzintervall für ist wobei ist das Level-Quantil eines Chi-Quadrats mit Freiheitsgraden. Dies gilt natürlich für alle . Dies ist zwar das beliebteste Intervall ( aus offensichtlichen Gründen als gleichschenkliges Intervall bezeichnet), es ist jedoch weder das einzige noch dasjenige mit der geringsten Breite! Es sollte offensichtlich sein, dass eine andere gültige Auswahl ist T = n i = 1 (n2 ( 1 - α ) σ 2 ( TT=i=1n(XiX¯)2 (1α)σ2Q k , a a k μ ( 0 , T

(Tqn1,(1α)/2,Tqn1,α/2),
qk,aakμ
(0,Tqn1,α).

Da , dann auch eine Abdeckung von mindestens .Ti=1nXi2( 1 - α )

(0,i=1nXi2qn1,α),
(1α)

Vor diesem Hintergrund könnten wir dann optimistisch sein, dass das Intervall im Hauptanspruch für . Der Hauptunterschied besteht darin, dass es für den Fall einer einzelnen Beobachtung keine Chi-Quadrat-Verteilung mit null Freiheitsgraden gibt. Wir müssen also hoffen, dass die Verwendung eines Quantils mit einem Freiheitsgrad funktioniert.n=1

Ein halber Schritt in Richtung Ziel ( Den rechten Schwanz ausnutzen )

Bevor wir uns mit einem Beweis der Hauptbehauptung befassen, schauen wir uns zunächst eine vorläufige Behauptung an, die bei weitem nicht so stark oder statistisch befriedigend ist, aber vielleicht einen zusätzlichen Einblick in das gibt, was vor sich geht. Sie können zum Nachweis der Hauptforderung weiter unten springen, ohne große (wenn überhaupt) Verluste zu erleiden. In diesem und im nächsten Abschnitt basieren die Beweise - obwohl sie etwas subtil sind - nur auf elementaren Fakten: Monotonie der Wahrscheinlichkeiten sowie Symmetrie und Unimodalität der Normalverteilung.

Zusätzliche Behauptung : ist ein Konfidenzintervall für , solange . Hier ist das Level-Quantil einer Standardnormalen.( 1[0,X2/zα2)σ 2 α > 1 / 2 z α α(1α)σ2α>1/2zαα

Beweis . undNach Symmetrie können wir also im Folgenden ohne Verlust der Allgemeinheit nehmen. Für und ist nun und so sehen wir mit , dass Dies funktioniert nur für , da dies für erforderlich ist .| σ Z + μ | d = | - σ Z + μ | μ 0 θ 0 μ 0 P ( | X|X|=|X||σZ+μ|=d|σZ+μ|μ0θ0μ0Θ = z & agr; & sgr;

P(|X|>θ)P(X>θ)=P(σZ+μ>θ)P(Z>θ/σ),
θ=zασα > 1 / 2 z α > 0
P(0σ2<X2/zα2)1α.
α>1/2zα>0

Dies beweist den Hilfsanspruch. Obwohl illustrativ, ist es aus statistischer Sicht unbefriedigend, da es ein absurd großes erfordert, um zu funktionieren.α

Den Hauptanspruch beweisen

Eine Verfeinerung des obigen Arguments führt zu einem Ergebnis, das für ein beliebiges Konfidenzniveau geeignet ist. Beachten Sie zunächst, dass Setze und . Dann ist Wenn wir zeigen können, dass die rechte Seite in für jedes feste zunimmt , können wir ein ähnliches Argument wie im vorherigen Argument verwenden. Dies ist zumindest plausibel, da wir glauben möchten, dass es wahrscheinlicher wird, dass wir einen Wert mit einem Modul sehen, der über , wenn sich der Mittelwert erhöhta = μ / σ 0 b = θ / σ 0 P

P(|X|>θ)=P(|Z+μ/σ|>θ/σ).
a=μ/σ0b=θ/σ0a b b
P(|Z+a|>b)=Φ(ab)+Φ(ab).
abb. (Wir müssen jedoch aufpassen, wie schnell die Masse im linken Schwanz abnimmt!)

Setze . Dann ist Man beachte , dass und für die positive , in abnimmt . Nun ist für leicht zu erkennen, dass . Diese Tatsachen zusammengenommen implizieren leicht, dass für alle und alle festen .f ' b ( a ) = φ ( a -fb(a)=Φ(ab)+Φ(ab)f ' b ( 0 ) = 0

fb(a)=φ(ab)φ(ab)=φ(ab)φ(a+b).
fb(0)=0φ ( u ) u a ( 0 , 2 b ) φ (uφ(u)ua(0,2b)fφ(ab)φ(b)=φ(b)a0b0
fb(a)0
a0b0

Daher haben wir gezeigt , dass für und , b 0 P ( | Z + a | > b ) P ( | Z | > b ) = 2 Φ ( - b )a0b0

P(|Z+a|>b)P(|Z|>b)=2Φ(b).

Wenn wir all dies auflösen und , erhalten wir was den Hauptanspruch begründet.P(X2>qα& sgr;2)P(Z2>qα)=1-αθ=qασ

P(X2>qασ2)P(Z2>qα)=1α,

Schlussbemerkung : Eine sorgfältige Lektüre des obigen Arguments zeigt, dass nur die symmetrischen und unimodalen Eigenschaften der Normalverteilung verwendet werden. Daher funktioniert der Ansatz analog zum Erhalten von Konfidenzintervallen aus einer einzelnen Beobachtung aus einer beliebigen symmetrischen unimodalen Ortsskalenfamilie, z. B. Cauchy- oder Laplace-Verteilungen.

Kardinal
quelle
Wow! und von den Schülern wird erwartet, dass sie diese Art von Argumenten in der kurzen Zeit einer Olympiadeprüfung vorbringen?
Dilip Sarwate
1
@ Dilip: Ich habe keine Ahnung! Ich bin mit dem Format dieser Olympiade oder den erwarteten Lösungen nicht vertraut. Nach einer wörtlichen Lesart würde ich Scortchis Antwort für akzeptabel halten. Ich war mehr daran interessiert, herauszufinden, wie weit man mit einer "nicht trivialen" Lösung kommen könnte. Meine eigene (ziemlich minimale) Erforschung folgte dem gleichen Gedankengang, der in der Antwort beschrieben wurde (mit einem Umweg). Es ist sehr wahrscheinlich, dass es eine bessere Lösung gibt. :-)
Kardinal
Dies ist erheblich länger als die "offizielle" Lösung, aber es gibt eine bessere Grenze für die Varianz, also markiere ich es als die "richtige" Antwort. Ich habe die "offizielle" Antwort unten gepostet sowie einige Simulationsergebnisse und Diskussionen. Danke, Kardinal!
Jonathan Christensen
2
@ Jonathan: Danke. Ja, ich hätte den Beweis etwas knapper machen können. Aufgrund des breiten Spektrums an Hintergründen der Teilnehmer neige ich oft dazu, mich zusätzlichen (oder vielleicht übermäßigen) Details hinzugeben. :-)
Kardinal
12

Zeit zum Nachfassen! Hier ist die Lösung, die mir gegeben wurde:

Wir werden ein Konfidenzintervall der Form konstruieren , wobei eine Statistik ist. Per Definition ist dies ein Konfidenzintervall mit einem Konfidenzniveau von mindestens 99%, wenn Wir stellen fest, dass die Dichte der -Verteilung nicht überschreitet . Daher ist für jedes . Daraus folgt, dass Einstecken von[0,T(X))T()

(μR)(σ>0)Pμ,σ2(σ2>T(X))<0.01.
N(μ,σ2) P(|X|a)a/σ1/σ2πP(|X|a)a/σt P ( | X | / σ t ) = P (a0
tP(|X|/σt)=P(X2t2σ2)=P(σ2X2/t2).
t=0.01Wir erhalten, dass die entsprechende StatistikT(X)=10000X2.

Das Konfidenzintervall (das sehr breit ist) ist in der Simulation etwas konservativ, und es liegt keine empirische Abdeckung (in 100.000 Simulationen) unter 99,15%, da ich den CV über viele Größenordnungen variierte.

Zum Vergleich habe ich auch das Konfidenzintervall des Kardinals simuliert. Ich möchte darauf hinweisen, dass das Intervall von Kardinal etwas kürzer ist - im Falle von 99% beträgt es bis zu , im Gegensatz zu in der bereitgestellten Lösung. Die empirische Abdeckung liegt genau auf dem nominalen Niveau, wiederum über viele Größenordnungen des Lebenslaufs. Seine Pause gewinnt also definitiv.6300X210000X2

Ich hatte keine Zeit, mir die Zeitung, die Max gepostet hat, genau anzuschauen, aber ich habe vor, mir das anzuschauen und möglicherweise später (dh nicht früher als eine Woche) einige Kommentare dazu hinzuzufügen. In diesem Papier wird ein Konfidenzintervall von 99% von , das eine empirische Abdeckung aufweist, die geringfügig niedriger ist (etwa 98,85%) als die nominelle Abdeckung für große Lebensläufe in meinen kurzen Simulationen.(0,4900X2)

Jonathan Christensen
quelle
1
(+1) Das ist eine schöne Lösung. Sollten Sie anstelle von in der Anzeigegleichung haben? tt
Kardinal
2
Noch ein paar Punkte: Ihre Lösung kann ohne Änderung des Arguments so gestaltet werden, dass sie meiner sehr nahe kommt. Beachten Sie, dass Sie behaupten können, dass . Dann wird das Intervall für any . Die Verwendung von ergibt Vergleich zu in meiner Antwort. Je höher das Konfidenzniveau (dh je kleiner das ), desto näher ist Ihre Methode an meiner (obwohl Ihr Intervall immer breiter sein wird). (P(|X|a)2a/σ2πα α = 0,01 T ((0,2X2/πα2)αα=0.01T(X)6366.198X21/q0.016365.864α
Kardinal
1
Zweitens habe ich mir dieses Papier nicht angesehen, aber ich habe starke Zweifel, dass ein gültiges Konfidenzintervall von 99% sein kann. Betrachten Sie in der Tat alle Konfidenzintervalle der Form für einige . Wenn dann , haben wir, dass genau mit einem Freiheitsgrad Chi-Quadrat ist, und so ist das kleinste wir in diesem Fall auswählen könnten, . Mit anderen Worten, das in meiner Antwort angegebene Intervall ist das engstmögliche der angegebenen Form. ( 0 , b × 2 ) b μ = 0 × 2 / σ 2 b b = 1 / q α(0,4900X2)(0,bX2)bμ=0X2/σ2bb=1/qα
Kardinal
1
Ich habe die (vermutete) Tippfehlerbehebung vorgenommen. Auch pchisq(1/4900,1,lower.tail=F)in Rkehrt 0.9886, ganz in der Nähe Ihrer Simulationsergebnisse für das Intervall. (0,4900X2)
Kardinal
1
Vielen Dank für alle Kommentare, @ Cardinal. Ich denke, Ihre Änderung ist korrekt, obwohl ich sie so getippt habe, wie sie in den ursprünglichen Lösungen war - Tippfehler, denke ich.
Jonathan Christensen
5

Die CIs vermutlich.(0,)

Scortchi - Wiedereinsetzung von Monica
quelle
1
Ich denke, es wäre hilfreich für Sie zu sagen, warum Sie kein Konfidenzintervall mit endlicher Länge erhalten können.
Angenommen,
1
@Max Ich bin nicht schlau genug - aber die Frage hat nicht nach einer gefragt.
Scortchi
4
+1 dafür. Die Frage besagte kein CI mit minimaler Abdeckung und impliziert in der Tat, dass dies durch seine merkwürdige Formulierung akzeptabel sein könnte, "ein Konfidenzintervall mit einem Konfidenzniveau von mindestens 99%".
Ari B. Friedman