Dies ist ein Problem der "7. Kolmogorov-Studentenolympiade in der Wahrscheinlichkeitstheorie":
Geben Sie bei einer Beobachtung aus einer mit beiden unbekannten Parametern ein Konfidenzintervall für mit einem Konfidenzniveau von mindestens 99% an.
Es scheint mir, dass dies unmöglich sein sollte. Ich habe die Lösung, aber noch nicht gelesen. Irgendwelche Gedanken?
Ich werde die Lösung in ein paar Tagen veröffentlichen.
[Nachbearbeitung: Offizielle Lösung siehe unten. Die Lösung von Cardinal ist länger, bietet jedoch ein besseres Konfidenzintervall. Danke auch an Max und Glen_b für ihren Input.]
probability
normal-distribution
confidence-interval
variance
Jonathan Christensen
quelle
quelle
Antworten:
Unter Berücksichtigung von Wahrscheinlichkeitsungleichheiten und Zusammenhängen mit dem Mehrfachbeobachtungsfall erscheint dieses Ergebnis möglicherweise nicht so unmöglich oder zumindest plausibler.
Lassen Sie mit und unbekannt. Wir können für schreiben .μ ≤ 2 X = σ Z + μ Z ≤ N ( 0 , 1 )X∼N(μ,σ2) μ σ2 X=σZ+μ Z∼N(0,1)
Grund zum Optimismus
Recall , dass in dem Fall mit , der typischen Konfidenzintervall für ist wobei ist das Level-Quantil eines Chi-Quadrats mit Freiheitsgraden. Dies gilt natürlich für alle . Dies ist zwar das beliebteste Intervall ( aus offensichtlichen Gründen als gleichschenkliges Intervall bezeichnet), es ist jedoch weder das einzige noch dasjenige mit der geringsten Breite! Es sollte offensichtlich sein, dass eine andere gültige Auswahl ist T = ∑ n i = 1 (n≥2 ( 1 - α ) σ 2 ( TT=∑ni=1(Xi−X¯)2 (1−α) σ2 Q k , a a k μ ( 0 , T
Da , dann auch eine Abdeckung von mindestens .T≤∑ni=1X2i ( 1 - α )
Vor diesem Hintergrund könnten wir dann optimistisch sein, dass das Intervall im Hauptanspruch für . Der Hauptunterschied besteht darin, dass es für den Fall einer einzelnen Beobachtung keine Chi-Quadrat-Verteilung mit null Freiheitsgraden gibt. Wir müssen also hoffen, dass die Verwendung eines Quantils mit einem Freiheitsgrad funktioniert.n = 1
Ein halber Schritt in Richtung Ziel ( Den rechten Schwanz ausnutzen )
Bevor wir uns mit einem Beweis der Hauptbehauptung befassen, schauen wir uns zunächst eine vorläufige Behauptung an, die bei weitem nicht so stark oder statistisch befriedigend ist, aber vielleicht einen zusätzlichen Einblick in das gibt, was vor sich geht. Sie können zum Nachweis der Hauptforderung weiter unten springen, ohne große (wenn überhaupt) Verluste zu erleiden. In diesem und im nächsten Abschnitt basieren die Beweise - obwohl sie etwas subtil sind - nur auf elementaren Fakten: Monotonie der Wahrscheinlichkeiten sowie Symmetrie und Unimodalität der Normalverteilung.
Zusätzliche Behauptung : ist ein Konfidenzintervall für , solange . Hier ist das Level-Quantil einer Standardnormalen.( 1[ 0 , X2/ z2α) σ 2 α > 1 / 2 z α α( 1 - α ) σ2 α > 1 / 2 zα α
Beweis . undNach Symmetrie können wir also im Folgenden ohne Verlust der Allgemeinheit nehmen. Für und ist nun und so sehen wir mit , dass Dies funktioniert nur für , da dies für erforderlich ist .| σ Z + μ | d = | - σ Z + μ | μ ≥ 0 θ ≥ 0 μ ≥ 0 P ( | X| X| = | -X| | σZ+ μ | =d| -σZ+ μ | μ ≥ 0 θ ≥ 0 μ ≥ 0 Θ = z & agr; & sgr;
Dies beweist den Hilfsanspruch. Obwohl illustrativ, ist es aus statistischer Sicht unbefriedigend, da es ein absurd großes erfordert, um zu funktionieren.α
Den Hauptanspruch beweisen
Eine Verfeinerung des obigen Arguments führt zu einem Ergebnis, das für ein beliebiges Konfidenzniveau geeignet ist. Beachten Sie zunächst, dass Setze und . Dann ist Wenn wir zeigen können, dass die rechte Seite in für jedes feste zunimmt , können wir ein ähnliches Argument wie im vorherigen Argument verwenden. Dies ist zumindest plausibel, da wir glauben möchten, dass es wahrscheinlicher wird, dass wir einen Wert mit einem Modul sehen, der über , wenn sich der Mittelwert erhöhta = μ / σ ≥ 0 b = θ / σ ≥ 0 P
Setze . Dann ist Man beachte , dass und für die positive , in abnimmt . Nun ist für leicht zu erkennen, dass . Diese Tatsachen zusammengenommen implizieren leicht, dass für alle und alle festen .f ' b ( a ) = φ ( a -fb(a)=Φ(a−b)+Φ(−a−b) f ' b ( 0 ) = 0
Daher haben wir gezeigt , dass für und , b ≥ 0 P ( | Z + a | > b ) ≥ P ( | Z | > b ) = 2 Φ ( - b )a≥0 b≥0
Wenn wir all dies auflösen und , erhalten wir was den Hauptanspruch begründet.P(X2>qα& sgr;2)≥P(Z2>qα)=1-αθ=qα−−√σ
Schlussbemerkung : Eine sorgfältige Lektüre des obigen Arguments zeigt, dass nur die symmetrischen und unimodalen Eigenschaften der Normalverteilung verwendet werden. Daher funktioniert der Ansatz analog zum Erhalten von Konfidenzintervallen aus einer einzelnen Beobachtung aus einer beliebigen symmetrischen unimodalen Ortsskalenfamilie, z. B. Cauchy- oder Laplace-Verteilungen.
quelle
Zeit zum Nachfassen! Hier ist die Lösung, die mir gegeben wurde:
Das Konfidenzintervall (das sehr breit ist) ist in der Simulation etwas konservativ, und es liegt keine empirische Abdeckung (in 100.000 Simulationen) unter 99,15%, da ich den CV über viele Größenordnungen variierte.
Zum Vergleich habe ich auch das Konfidenzintervall des Kardinals simuliert. Ich möchte darauf hinweisen, dass das Intervall von Kardinal etwas kürzer ist - im Falle von 99% beträgt es bis zu , im Gegensatz zu in der bereitgestellten Lösung. Die empirische Abdeckung liegt genau auf dem nominalen Niveau, wiederum über viele Größenordnungen des Lebenslaufs. Seine Pause gewinnt also definitiv.6300X2 10000X2
Ich hatte keine Zeit, mir die Zeitung, die Max gepostet hat, genau anzuschauen, aber ich habe vor, mir das anzuschauen und möglicherweise später (dh nicht früher als eine Woche) einige Kommentare dazu hinzuzufügen. In diesem Papier wird ein Konfidenzintervall von 99% von , das eine empirische Abdeckung aufweist, die geringfügig niedriger ist (etwa 98,85%) als die nominelle Abdeckung für große Lebensläufe in meinen kurzen Simulationen.(0,4900X2)
quelle
pchisq(1/4900,1,lower.tail=F)
inR
kehrt0.9886
, ganz in der Nähe Ihrer Simulationsergebnisse für das Intervall.Die CIs vermutlich.(0,∞)
quelle