Beweisen Sie, dass als

8

Statistische Probleme mit Konfidenzintervallen für einen Populationsmittelwert können anhand der folgenden Gewichtungsfunktion dargestellt werden :

w(α,n)tn1,α/2nfor 0<α<1 and n>1.

Zum Beispiel kann das Standard- Konfidenzintervall der klassischen Ebene für den Mittelwert einer unendlichen Superpopulation wie folgt geschrieben werden:1α

CI(1α)=[x¯n±w(α,n)sn].

Es ist trivial, die Grenzen und \ lim _ {\ alpha \ uparrow 1} w (\ alpha, n) = 0 unter Verwendung der Quantilfunktion von festzulegen die T-Verteilung. Im Zusammenhang mit Konfidenzintervallen zeigt dies, dass das Intervall mit abnehmendem Konfidenzniveau auf einen einzelnen Punkt schrumpft und mit zunehmendem Konfidenzniveau auf die gesamte reale Linie ansteigt. Eine weitere intuitive Eigenschaft, die gelten sollte, ist, dass das Intervall auf einen einzelnen Punkt verkleinert wird, wenn wir mehr und mehr Daten erhalten. Dies bedeutet:limα0w(α,n)=limα1w(α,n)=0

limnw(α,n)=0.

Frage: Bitte legen Sie einen Beweis für diese letztere Eigenschaft der Gewichtungsfunktion vor.


Weitere Informationen: Für alle mathematischen Leser, die mit den kritischen Punkten der T-Verteilung nicht vertraut sind , ist der Wert eine Funktion von die durch die implizite Gleichung definiert wird: ntn1,α/2n

α2=1(n1)πΓ(n2)Γ(n12)tn1,α/2(1+r2n1)n/2dr.
Ben - Monica wieder einsetzen
quelle
2
Ist das nicht trivial, weil die Schüler nicht zu einer normalen Gesamtvariation konvergieren? Der Zähler geht zur Konstante . zα/2
Kerl
1
@guy: Was "trivial" ist, hängt von der Ebene der Person ab, die Sie fragen. Der Grund, warum ich diese Frage stelle, ist, dass dies ein Problem ist, das ich einigen Studenten in meinem Unterricht gestellt habe, und ich möchte sehen, welche Art von Beweisen die Leute auf dieser Site finden (damit ich dies mit dem vergleichen kann Arten von Antworten von Studenten). Studenten haben normalerweise eine ungefähre Vorstellung davon, wie sie sich dem Beweis nähern sollen, kämpfen jedoch mit den Details. Die meisten versuchen, und gehen von dort aus, aber andere versuchen, es zu lösen, indem sie eine Grenze für das Integral festlegen. tn1,α/2zα/2<
Ben - Reinstate Monica
(Ich hoffe auch, den elegantesten Beweis zu sehen, um das Ergebnis gut zu präsentieren.)
Ben - Reinstate Monica
2
Es würde mich interessieren, wie elegant jemand das bekommen kann. Persönliche Meinung, aber ich würde argumentieren, dass die Verwendung der Dichten nicht elegant ist, weil sie zusätzliche Strukturen einbringt, die nicht benötigt werden. Der Beweis in meiner Antwort hat zwei wichtige Lektionen. Erstens ist der Satz ein nützliches Stück Wahrscheinlichkeitstheorie und kann eine Vorstellung davon geben, wie sich DFs verhalten. Zweitens ist die Proof-Technik (die in Bezug auf Deckungszahlen angepasst werden kann) sehr nützlich, um viele Dinge zu beweisen.
Kerl

Antworten:

4

Beweis mit Chebyshevs Ungleichung

Hier ist ein Beweis unter Verwendung der Chebyshevschen Ungleichung .Pr(|T|kσ)1k2

Wenn wir ausfüllen und dann haben wir ein Limitσtν=νν21/k2=α=Pr(|T|tν,α/2)

Pr(|T|νν21α)Pr(|T|tν,α/2)

somit wird oben durch begrenzttν,α/2

tν,α/2νν21α

Hinzufügen der offensichtlichen Untergrenze und Teilen durchν+1

0tn1,α/2ν+1νν+1(ν2)1α

was für auf Null drückt ntn1,α/2/nn

Sextus Empiricus
quelle
Normalerweise vermeide ich "nette Antwort" -Kommentare, aber dieser ist wirklich elegant! (+1 offensichtlich!)
usεr11852
1
@ usεr11852 Vielleicht gefällt Ihnen mein geometrischer Beweis, bei dem die Verteilung der t-Statistik mit der Verteilung eines Winkels im n-Raum zusammenhängt.
Sextus Empiricus
4

Ich bin mir sicher, dass es einen einfacheren Weg gibt, dies zu tun, aber das Ergebnis ergibt sich unmittelbar aus dem Folgenden:

Satz: Sei eine kontinuierliche Verteilungsfunktion und eine Folge von Verteilungsfunktionen, so dass schwach (dh in der Verteilung) ist. Dann ist gleichmäßig in .F n F nF F n ( x ) F ( x ) xFFnFnFFn(x)F(x)x

Beweis: Unter Verwendung von Kontinuität und Monotonie können wir für jede natürliche Zahl so auswählen dass (unter und ). Durch schwache Konvergenz und die Tatsache, dass stetig ist, wird . Suchen Sie für jedes ein Intervall das und beachten Sie, dass . Daher und weilx 0 , x 1 , ... , x m F ( x j ) = j / m x 0 = - x m = F F n ( x j ) F ( x j ) y [ x j - 1 , x j ] y | F n ( y ) - F.mx0,x1,,xmF(xj)=j/mx0=xm=FFn(xj)F(xj)y[xj1,xj]y¯ lim nsupy| Fn(y)-F(y)| 1|Fn(y)F(y)|supj|Fn(xj)F(xj)|+|F(xj)F(xj1)|1m msupy| Fn(y)-F(y)| 0lim¯nsupy|Fn(y)F(y)|1mmwar willkürlich wir bekommen .supy|Fn(y)F(y)|0

Als nächstes ist es eine bekannte Anwendung des Slutsky-Theorems, dass das in der Verteilung zu einer Standardnormalverteilung konvergiert. Das vorherige Ergebnis impliziert, dass , dh . Wenn wir die normale Quantilfunktion auf beide Seiten , erhalten wir . F n ( t n - 1 , α ) - F ( t n - 1 , α ) 0 F ( t n - 1 , α ) α t n - 1 , αz αtn1Fn(tn1,α)F(tn1,α)0F(tn1,α)αtn1,αzα

Daher impliziert für jedes (insbesondere ).t n - 1 , αtn1,αzαg(n)g(n)=tn1,αg(n)0g(n)g(n)=n

Kerl
quelle
3

Geometrischer Beweis

Geometrische Ansicht

Betrachten Sie die beobachtete Probe als einen Punkt im n-dimensionalen euklidischen Raum und die Schätzung des Mittelwerts als Projektion einer Beobachtung auf die Modelllinie .x 1 = x 2 = . . . = x n = ˉ xx1,x2,...,xnx1=x2=...=xn=x¯

Der t-Score kann als Verhältnis zweier Abstände in diesem Raum ausgedrückt werden

  • Der Abstand zwischen dem projizierten Punkt und der Grundgesamtheit bedeutet
    n(x¯μ)
  • der Abstand zwischen diesem Punkt und der Beobachtung
    i=1n(x^xi)2

Dies hängt mit der Tangente des Winkels zwischen der Beobachtung und der Linie zusammen, auf die sie projiziert wird.

tn1=n(x¯μ)i=1n(x^xi)2=1tanθ

Geometrische Skizze

Äquivalenz-t-Verteilung und Winkelverteilung

In dieser geometrischen Ansicht entspricht die Wahrscheinlichkeit, dass der t-Score höher als ein Wert ist, der Wahrscheinlichkeit, dass der Winkel kleiner als ein Wert ist:

Pr(|T|>tn1,α/2)=2Pr(θθν,α)=α

Oder

tn1,α/2n1=1tanθν,α

Man könnte sagen, dass sich der t-Score auf den Beobachtungswinkel mit der Linie des theoretischen Modells bezieht. Für Punkte außerhalb des Konfidenzintervalls (dann ist weiter von und der Winkel ist kleiner) liegt der Winkel unter einer bestimmten Grenze . Diese Grenze wird sich mit weiteren Beobachtungen ändern. Wenn die Grenze dieses Winkels für großes auf 90 Grad geht (die Kegelform wird flacher, dh weniger spitz und lang), bedeutet dies, dass die Größe des Konfidenzintervalls kleiner wird und sich nähert Null.ˉ x θ ν , α θ ν , α nμx¯θν,αθν,αn

Winkel vs t

Winkelverteilung als relative Fläche der Kappe einer n-Kugel

Aufgrund der Symmetrie der gemeinsamen Wahrscheinlichkeitsverteilung unabhängiger normalverteilter Variablen ist jede Richtung gleich wahrscheinlich und die Wahrscheinlichkeit, dass sich der Winkel innerhalb eines bestimmten Bereichs befindet, ist gleich der relativen Fläche der Kappe einer n-Kugel.

Die relative Fläche dieser n-Kappe wird durch Integrieren der Fläche eines n-Kegelstumpfes ermittelt :

2Pr(θθc)=211+tan(θc)21(1x2)n32B(12,n12)dx=11+tan(θc)21t0.5(1t)n32B(12,n12)dt=I11+tan(θc)2(12,n12)

Dabei ist die obere regulierte unvollständige Beta-Funktion.Ix(,)

Winkelgrenze

Wenn bis 90 Grad für geht dann auf Null geht.θn,αntn1,α/2/n

Oder eine umgekehrte Aussage: Für jeden Winkel, der kleiner als 90 Grad ist, nimmt die relative Fläche dieses Winkels auf einer n-Kugel auf Null ab, wenn gegen unendlich geht.n

Intuitiv bedeutet dies, dass sich alle Bereiche einer n-Kugel auf den Äquator konzentrieren, wenn die Dimension auf unendlich ansteigt.n

Quantitativ können wir dies mit dem Ausdruck zeigen

a1t0.5(1t)n32B(12,n12)dt<a1(1a)n32B(12,n12)dt=(1a)n12B(12,n12)=L(n)

und betrachte den Unterschied zwischen und .L(n+2)L(n)

Irgendwann ist die Abnahme des Nenners wird durch die Verringerung des Zählers übernommen und die Funktion nimmt für bis unendlich auf Null ab .

B(12,x+1)B(12,x)=xx+12
(1a)n+12(1a)n12=1a
L(n)n
Sextus Empiricus
quelle
1

Wir haben

α2=tn1,α/2limn1(n1)πΓ(n2)Γ(n12)(1+r2n1)n/2dr=tn1,α/212πe12r2dr=1Φ(tn1,α/2)1[12+φ(tn1,α/2)(tn1,α/2+(tn1,α/2)33+(tn1,α/2)515+)]

was bedeutet , dass der zweite Term in den Klammern geschachtelt höchstens sein kann , da die maximale werden kann , ist . Beachten Sie, dass das PDF der Normalverteilung ist. Diese Annäherung wird auch auf der Grundlage dieser .12α1φ(x)

Also

0<α1+2φ(tn1,α/2)(tn1,α/2+(tn1,α/2)33+(tn1,α/2)515+)<1
Guerhuerh
quelle
Willkommen auf der Website @guerhuerh. Bitte erwägen Sie, Ihr Konto zu registrieren und hier ein reguläres Mitglied zu werden (Informationen finden Sie im Abschnitt Mein Konto in unserer Hilfe ). Wir würden uns freuen, Sie zu haben. Wenn Sie möchten, können Sie an unserer Tour teilnehmen , die Informationen für neue Benutzer enthält.
Gung - Reinstate Monica
2
Dies ist ein interessanter Ansatz, aber mir ist unklar, wie Sie den ersten Schritt rechtfertigen (bei dem Sie die Grenzwertoperation innerhalb des Integrals hinzugefügt haben). Dies ergibt eine implizite Gleichung für , die falsch ist. tn1,α/2
Ben - Reinstate Monica
@Ben: Wäre ? limnα2=α2
PEV
@PEV: Ja, aber dann sollte die rechte Seite die Grenze außerhalb des Integrals haben, nicht innerhalb. Da die Grenzen im Integral von abhängen, ist die rechte Seite gegenwärtig eine Funktion von , so dass sie nicht gleich . n α / 2nnα/2
Ben - Reinstate Monica
@PEV: Ich denke, die Methode könnte geändert werden, indem das Integral in zwei Teile geteilt wird, von denen einer die Untergrenze durch und einer den Rest ergibt. Ersteres würde dann zu dem konvergieren, was bereits gezeigt wurde, und wir müssten dann zeigen, dass Letzteres zu Null konvergiert. Wie gesagt, ich denke, das ist ein interessanter Ansatz. Es könnte als Methode von Nutzen sein und möglicherweise geändert werden, um korrekt zu sein, aber es ist derzeit falsch. zα/2
Ben - Reinstate Monica