Wenn n zunimmt, steigt der t-Wert in einem Hypothesentest an, aber die t-Tabelle ist genau das Gegenteil. Warum?

8

Die Formel für in einem Hypothesentest lautet: t = ˉ X - μt

t=X¯μσ^/n.

Wenn zunimmt, steigt der Wert gemäß der obigen Formel an. Aber warum nimmt der kritische Wert in der Tabelle ab, wenn (was eine Funktion von ) zunimmt?t t t df nntttdfn

Leviathan
quelle

Antworten:

9

Dies sind zwei verschiedene Phänomene:

  1. Statistikt

    Wenn alles andere konstant gehalten wird und erhöht wird, muss der t- Wert einfach arithmetisch ansteigen. Betrachten wir den Anteil im Nenner, σ / Nt , wennngrößer wird, dannσ^/nn wird ebenfalls größer (wenn auch langsamer), da die Quadratwurzel eine monotone Transformation ist. Da die Quadratwurzel vonnder Nenner dieser Fraktion ist, wird die Fraktion kleiner, wenn sie größer wird. Dieser Bruchteil ist jedoch wiederum ein Nenner. Infolgedessen wird der zweite Bruch größer, wenn dieser Nenner kleiner wird. Somit wird dert-Wert größer, wennngrößer wird. (UnterAnnahme wiederum, dass σ und( ˉ x -μ n u l l ). Bleibt unverändert) nntnσ^(x¯μnull)

    Was bedeutet das konzeptionell? Nun, je mehr Daten wir haben / je näher die Stichprobengröße an der Populationsgröße liegt, desto weniger weicht der Stichprobenmittelwert aufgrund von Stichprobenfehlern tendenziell vom Populationsmittelwert ab (vgl. Das Gesetz der großen Zahlen ). Bei einer kleinen, endlichen Population ist dies leicht zu erkennen, aber obwohl es möglicherweise nicht so intuitiv ist, gilt dies auch, wenn die Population unendlich ist. Da der Stichprobenmittelwert ( x¯) sollte nicht sehr weit vom Referenzwert (Null) abweichen, wir können sicherer sein, dass der beobachtete Abstand des Stichprobenmittelwerts von der Null darin besteht, dass der Nullwert nicht der Mittelwert der Population ist, aus der die Stichprobe gezogen wurde . Genauer gesagt wird es immer weniger wahrscheinlich, dass ein Stichprobenmittelwert so weit oder weiter vom Nullwert entfernt gefunden wurde, wenn der Nullwert tatsächlich der Mittelwert der Population war, aus der die Stichprobe gezogen wurde.

  2. Verteilungt

    Wenn Sie sich eine Tabelle ansehen (z. B. am Ende eines Statistikbuchs), sehen Sie tatsächlich eine Tabelle mit kritischen Werten . Das heißt, der Wert, dass die beobachtete t- Statistik größer sein muss als, damit der Test bei diesem Alpha "signifikant" ist. ( In der Regel werden diese für eine kleine Anzahl von möglichen Alphas aufgelistet: α = { .10 , .05 , .01 , .001 } .) Ich vermute , wenn man genau in solchen Tabellen betrachten, denken sie tatsächlich in Bezug auf den Grad der mit der fraglichen t- Statistik verbundenen Freiheit . Beachten Sie, dass die Freiheitsgrade für diettα={.10, .05, .01, .001}t -statistic ist eine Funktion von n ist , wobei d f = n - 2 für eine Gruppe zwei t -test, oder d f = n - 1 für eine Gruppe T -Test (Ihr Beispiel scheint letzteres zu sein). Dies hat damit zu tun, dass die t- Verteilung gegen eine Standardnormalverteilung konvergiert, wenn sich die Freiheitsgrade der Unendlichkeit nähern. tndf=n2tdf=n1tt

    Der Weg, dies konzeptionell zu verstehen, besteht darin, darüber nachzudenken, warum Sie die Verteilung überhaupt verwenden müssent . Sie wissen, an welchem ​​Referenzmittelwert Sie interessiert sind und welchen Stichprobenmittelwert Sie beobachtet haben. Wenn die Population, aus der die Stichproben gezogen wurden, normal verteilt war (was häufig implizit angenommen wird), wissen wir, dass die Stichprobenverteilung des Mittelwerts ebenfalls normal verteilt ist. Warum sollte man sich also mit der Verteilung beschäftigen? Die Antwort ist, dass nicht sicher sind, wie hoch die Standardabweichung der Bevölkerung ist. (Wenn wir sicher waren, haben wir wirklich die Normalverteilung verwenden würde, das heißt, die z -Test anstelle der t - Test.) Also wir unsere Proben - Standardabweichung verwenden,tzt als Proxy für den unbekannten Populationswert. Doch je mehr Daten wir haben, desto sicherer können wir seindass σ istinTat etwa der richtige Wert. Dandie Populationsgröße (und / oder unendlich) nähert, können wir sicher seindass σ inTat istgenauder richtige Wert. Somit wird diet-VerteilungzurNormalverteilung. σ^σ^ nσ^t

gung - Monica wieder einsetzen
quelle
Das ist eine sehr lange Antwort. Warum nicht aus Kommentaren verschieben, um die Antwort zu sein?
Harvey Motulsky
Danke, @ HarveyMotulsky. Was meinst du mit dem letzteren Satz? Es wird als Antwort und nicht als Kommentar veröffentlicht.
Gung - Reinstate Monica
Entweder hat sich in letzter Minute etwas geändert, oder ich habe es falsch gesehen. Es ist eine großartige Antwort und wird als solche veröffentlicht.
Harvey Motulsky
Bedeutet dies, dass das in der t-Wert-Formel verwendete n nichts mit der Formel zu tun hat, mit der die kritischen t-Werte generiert werden? Was mich verwirrt, ist, dass mit zunehmendem df (was eine Funktion von n ist) in der t-Tabelle die kritischen t-Werte abnehmen, während dies beim t-Wert aus der Formel in der ursprünglichen Frage nicht der Fall ist. Obwohl wir an beiden Stellen das gleiche n sehen (Tabelle und Formel), verhalten sie sich unterschiedlich.
Leviathan
1
(Im Übrigen glaube ich, dass meine Antwort auf Ihre Frage als bearbeitet gerichtet ist. Lassen Sie mich wissen, wenn es noch an Klarheit mangelt.)
gung - Reinstate Monica
4

3

X1...Xn4μx¯=μt1n

t2n1tt-Verteilung, df = 2,3,5,20t-Wert ist die x-Position, an der die Fläche unter der Kurve einem etwas willkürlichen Wert Ihrer Wahl entspricht (traditionell 0,05). Diese Werte werden in der Grafik als Punkte markiert. Für die grüne Kurve (df = 5) beträgt die Fläche unter der Kurve links vom linken grünen Punkt = 0,025 und die Fläche unter der Kurve rechts vom rechten grünen Punkt = 0,025, was insgesamt 0,05 ergibt.

t

tttx¯=μ


13
zz
23
3
4

Affine
quelle