Wenn wir zwei unabhängige Stichprobenmittel untersuchen, wird uns gesagt, dass wir den "Unterschied zweier Mittel" betrachten. Dies bedeutet, dass wir den Mittelwert von Population 1 ( ) nehmen und den Mittelwert von Population 2 ( ) davon subtrahieren . Unsere "Differenz zweier Mittel" ist also ( - ).
Wenn wir gepaarte Stichproben untersuchen, wird uns gesagt, dass wir den "mittleren Unterschied" betrachten, . Dies wird berechnet, indem die Differenz zwischen jedem Paar und dann der Mittelwert aller dieser Unterschiede genommen wird.
Meine Frage ist: Erhalten wir dasselbe ( - ) gegenüber seinem wenn wir sie aus zwei Datenspalten berechnet haben und beim ersten Mal zwei unabhängige Stichproben und beim zweiten Mal als gepaart betrachtet haben Daten? Ich habe mit zwei Datenspalten herumgespielt und es scheint, dass die Werte gleich sind! Kann man in diesem Fall sagen, dass die verschiedenen Namen nur aus nicht quantitativen Gründen verwendet werden?
quelle
Antworten:
(Ich gehe davon aus, dass Sie in Ihrem ersten Absatz "Stichprobe" und nicht "Bevölkerung" meinen.)
Die Äquivalenz ist mathematisch leicht darzustellen. Beginnen Sie mit zwei gleich großen Stichproben: und . Definieren Sie dann{ y 1 , … , y n } ˉ x{ x1, … , X.n}} { y1, … , Y.n}}
Dann haben Sie:
quelle
Die Verteilung der mittleren Differenz sollte enger sein als die Verteilung der Mittelwertdifferenz. Sehen Sie dies anhand eines einfachen Beispiels: Mittelwert in Probe 1: 1 10 100 1000 Mittelwert in Probe 2: 2 11 102 1000 Mittelwertdifferenz ist 1 1 2 0 (im Gegensatz zu Proben selbst) hat einen kleinen Standard.
quelle