Ich habe mir dieses Notizbuch angesehen und bin verwirrt über diese Aussage:
Wenn wir über Normalität sprechen, meinen wir, dass die Daten wie eine Normalverteilung aussehen sollten. Dies ist wichtig, da sich mehrere statistische Tests darauf stützen (z. B. t-Statistik).
Ich verstehe nicht, warum eine T-Statistik die Daten benötigt, um einer Normalverteilung zu folgen.
In der Tat sagt Wikipedia dasselbe:
Die t-Verteilung des Schülers (oder einfach die t-Verteilung) ist ein Mitglied einer Familie kontinuierlicher Wahrscheinlichkeitsverteilungen, die bei der Schätzung des Mittelwerts einer normalverteilten Population auftritt
Ich verstehe jedoch nicht, warum diese Annahme notwendig ist.
Nichts aus seiner Formel weist mich darauf hin, dass die Daten einer Normalverteilung folgen müssen:
Ich habe ein bisschen nach seiner Definition gesucht, aber ich verstehe nicht, warum die Bedingung notwendig ist.
Ich denke, es kann einige Verwechslungen zwischen der Statistik und ihrer Formel im Vergleich zur Verteilung und ihrer Formel geben. Sie können die t-Statistikformel auf jeden Datensatz anwenden und eine "t-Statistik" erhalten. Diese Statistik wird jedoch nicht gemäß der Schüler-t-Verteilung verteilt, es sei denn, die Daten stammen aus einer Normalverteilung (oder zumindest nicht) Ich vermute, dass nicht normale Verteilungen keine Student-t-Verteilung erzeugen, wenn die t-Statistikformel angewendet wird, aber ich bin mir nicht sicher). Der Grund dafür ist einfach, dass die Verteilung der t-Statistik aus der Verteilung der Daten berechnet wird, die sie generiert haben. Wenn Sie also eine andere zugrunde liegende Verteilung haben, ist nicht garantiert, dass Sie dieselbe Verteilung für abgeleitete Statistiken haben.
quelle