Warum ist der Freiheitsgrad für ein übereinstimmendes Paar Test die Anzahl der Paare minus 1?

9

Ich bin es gewohnt, "Freiheitsgrade" als , wobei Sie das lineare Modell \ mathbf {y} = \ mathbf {X} \ boldsymbol {\ beta} + \ boldsymbol {\ epsilon} mit \ mathbf {y haben } \ in \ mathbb {R} ^ n , \ mathbf {X} \ in M_ {n \ times p} (\ mathbb {R}) die Entwurfsmatrix mit Rang r , \ boldsymbol {\ beta} \ in \ mathbb { R} ^ p , \ boldsymbol {\ epsilon} \ in \ mathbb {R} ^ n mit \ boldsymbol {\ epsilon} \ sim \ mathcal {N} (\ mathbf {0}, \ sigma ^ 2 \ mathbf {I} _n) , \ sigma ^ 2> 0 .nr

y=Xβ+ϵ
yRnXMn×p(R)rβRpϵRnϵN(0,σ2In)σ2>0

Soweit ich mich an die Elementarstatistik erinnere (dh vorlineare Modelle mit linearer Algebra), ist der Freiheitsgrad für den Matched-Pair- t Test die Anzahl der Differenzen minus 1 . Dies würde also bedeuten, dass X vielleicht Rang 1 hat. Ist das richtig? Wenn nicht, warum ist n1 der Freiheitsgrad für den Matched-Pair- t Test?

Angenommen, ich habe ein Modell mit gemischten Effekten

yijk=μi+ some random effects+eijk
wobei i=1,2 , j=1,,8 und k=1,2 . Es gibt nichts Besonderes an μi außer dass es ein fester Effekt ist und eijkiidN(0,σe2) . Ich gehe davon aus, dass die zufälligen Effekte für dieses Problem irrelevant sind, da wir uns in diesem Fall nur um die festen Effekte kümmern.

Ich möchte ein Konfidenzintervall für μ1μ2 .

Ich habe bereits gezeigt, dass d¯=18dj ein unvoreingenommener Schätzer von μ1μ2 , wobei dj=y¯1jy¯2j , y¯1j=12ky1jk und y¯21 ist ähnlich definiert. Die Punktschätzung d¯ wurde berechnet.

Ich habe bereits gezeigt, dass

sd2=j(djd¯)281
ein unvoreingenommener Schätzer der Varianz von dj , und Daher ist \ sqrt {\ dfrac {s ^ 2_d} {8}}
sd28
der Standardfehler von d¯ . Dies wurde berechnet.

Jetzt geht es im letzten Teil darum, die Freiheitsgrade herauszufinden. Für diesen Schritt versuche ich normalerweise, die Entwurfsmatrix zu finden - die offensichtlich Rang 2 hat -, aber ich habe die Lösung für dieses Problem und es heißt, dass die Freiheitsgrade .81

Warum sind die Freiheitsgrade im Zusammenhang mit der Ermittlung des Ranges einer Entwurfsmatrix ?81

Bearbeitet, um hinzuzufügen: Vielleicht hilfreich in dieser Diskussion ist, wie die Teststatistik definiert wird. Angenommen, ich habe einen Parametervektor . In diesem Fall ist (es sei denn, ich vermisse etwas vollständig). Wir führen im Wesentlichen den Hypothesentest wobei . Dann ist die Teststatistik gegeben durch die gegen eine zentrale Verteilung mit getestet würdenβ

β=[μ1μ2]
cβ=0
c=[11]
t=cβ^σ^2c(XX)1c
tnrFreiheitsgrade, wobei die Entwurfsmatrix wie oben ist und wobei .X
σ^2=y(IPX)ynr
PX=X(XX)1X
Klarinettist
quelle

Antworten:

5

Der Matched-Pair- Test mit Paaren ist eigentlich nur ein One-Sample- Test mit einer Stichprobe der Größe . Sie haben Unterschiede , und diese sind iid und normal verteilt. Die erste Spalte nach hattntnnd1,,dn

[d1dn]=[d¯d¯]+[d1d¯d1d¯]n d.f.1 d.f.(n1) d.f.
=''1Freiheitsgrad aufgrund der linearen Einschränkung, die besagt, dass alle Einträge gleich sind; Die zweite hat Freiheitsgrade aufgrund der linearen Einschränkung, die besagt, dass die Summe der Einträge .n10
Michael Hardy
quelle
Mit anderen Worten, der Grund, warum wir hier Freiheitsgrade haben, hat nichts mit dem linearen Modell zu tun ? n1y=Xβ+ϵ
Klarinettist
1
Es hat mit diesem Modell zu tun, bei dem die Matrix eine Spalte von s ist und eine Matrix ist, deren einziger Eintrag die Differenz zwischen den beiden Populationsmitteln ist. X1β1×1
Michael Hardy
2
Aha! Ihr -Vektor wäre also der Vektor von s, richtig? Vielen Dank! Ich kann nicht glauben, wie schwer es war, eine Antwort darauf zu finden! ydi
Klarinettist
Ja. Es ist der Vektor der beobachteten Unterschiede in den übereinstimmenden Paaren. n
Michael Hardy
2

Vielen, vielen Dank an Michael Hardy für die Beantwortung meiner Frage.

Die Idee ist folgende: Lassen Sie und . Dann ist unser lineares Modell wobei ist der Vektor aller und Offensichtlich hat Rang , also haben wir Freiheitsgrade .

y=[d1dn]
β=[μ1μ2]
y=1n×1β+ϵ
1n×1n
ϵ=[ϵ1ϵn]N(0,σ2In).
X=1n×11n1

Woher wissen wir, dass gleich ? Denken Sie daran, dass und wie leicht zu sehen ist, für alle . Angesichts unseres ist es offensichtlich, was sein sollte. Das ist weil β[μ1μ2]

E[y]=Xβ
E[dj]=μ1μ2jXβ
E[y]=E[[d1dn]]=[E[d1]E[dn]]=[μ1μ2μ1μ2]=Xβ=1n×1β=[11]β
so sollte eine Matrix mit .β1×1β=[μ1μ2]

Setze . Dann lautet unser Hypothesentest Unsere Teststatistik lautet also Wir haben Nach einiger Arbeit kann gezeigt werden, dass Es kann auch gezeigt werden, dassc=[1]

H0:cβ=0.
cβ^σ^2c(XX)1c.
σ^2=y(IPX)ynr(X).
PX=P1n×1=1n×1(1n)1.
IPXist symmetrisch und idempotent. Also, und
σ^2=y(IPX)ynr(X)=y(IPX)(IPX)ynr(X)=(IPX)y2nr(X)=[I1n×1(1n)1]y2n1=[d1dn][d¯d¯]2n1=i=1n(did¯)2n1=sd2
XX=1n×11n×1=n
was offensichtlich hat inverses , wodurch eine Teststatistik die auf einer zentralen Verteilung mit Grad von getestet würde Freiheit wie gewünscht.1/n
μ^1μ^2sd2/n
tn1
Klarinettist
quelle