Angenommen, ich führe ein Experiment durch, das zwei Ergebnisse haben kann, und ich gehe davon aus, dass die zugrunde liegende "wahre" Verteilung der beiden Ergebnisse eine Binomialverteilung mit den Parametern und : .p B i n o m i a l ( n , p )
Ich kann den Standardfehler aus der Varianz von berechnen : wobei . Also . Für den Standardfehler ich: , aber ich habe irgendwo gesehen, dass . Was habe ich falsch gemacht? Binomial(n,p)σ2X=npqq=1-pσX=√
SEX= √ SEX= √
binomial
standard-error
Frank
quelle
quelle
Antworten:
Anscheinend verwenden Sie zweimal auf zwei verschiedene Arten - sowohl als Stichprobengröße als auch als Anzahl der Bernoulli-Versuche, aus denen die Zufallsvariable Binomial besteht. um alle zweideutigkeiten zu beseitigen, werde ich , um auf letzteres Bezug zu nehmen.kn k
Wenn Sie unabhängige Stichproben aus einer -Verteilung haben, beträgt die Varianz ihres StichprobenmittelwertsB i n o m i a l ( k , p )n Binomial(k,p)
Dabei ist und der gleiche Mittelwert. Dies folgt seitq=1−p X¯¯¯¯
(1) , für jeden Zufallsvariable, und beliebigen Konstante .var(cX)=c2var(X) X c
(2) Die Varianz einer Summe unabhängiger Zufallsvariablen entspricht der Summe der Varianzen .
Der Standardfehler von ist die Quadratwurzel der Varianz: . Deshalb,X¯¯¯¯ kpqn−−−√
Wenn , erhalten Sie die Formel, auf die Sie hingewiesen haben:k=n pq−−√
Wenn und die Binomialvariablen nur Bernoulli-Versuche sind , erhalten Sie die Formel, die Sie an anderer Stelle gesehen haben:k=1 pqn−−√
quelle
Es ist leicht, zwei Binomialverteilungen zu verwechseln:
npq ist die Anzahl der Erfolge, während npq / n = pq das Verhältnis der Erfolge ist. Dies führt zu unterschiedlichen Standardfehlerformeln.
quelle
Wir können dies folgendermaßen betrachten:
Angenommen, wir machen ein Experiment, bei dem wir mal eine unvoreingenommene Münze werfen müssen . Das Gesamtergebnis des Experiments ist was die Summe der einzelnen Würfe ist (z. B. Kopf als 1 und Schwanz als 0). Für dieses Experiment ist also , wobei Ergebnisse einzelner Würfe sind.Y Y = ∑ n i = 1 X i X in Y Y=∑ni=1Xi Xi
Hier folgt das Ergebnis jedes Wurfs einer Bernoulli-Verteilung und das Gesamtergebnis einer Binomialverteilung. YXi Y
Das gesamte Experiment kann als einzelne Probe betrachtet werden. Wenn wir also das Experiment wiederholen, können wir einen anderen Wert von , der eine andere Stichprobe bildet. Alle möglichen Werte von bilden die gesamte Grundgesamtheit.YY Y
Zurück zu dem einzelnen Münzwurf, der einer Bernoulli-Verteilung folgt, ist die Varianz durch , wobei die Wahrscheinlichkeit des Kopfes (Erfolg) und .p q = 1 - ppq p q=1–p
Betrachten wir nun die Varianz von , so ist . Für alle einzelnen Bernoulli-Experimente gilt jedoch . Da das Experiment Würfe oder Bernoulli-Versuche enthält, ist . Dies impliziert, dass die Varianz .Y V(Y)=V(∑Xi)=∑V(Xi) V(Xi)=pq n V(Y)=∑V(Xi)=npq Y npq
Nun ist der Stichprobenanteil gegeben durch , was den 'Anteil von Erfolg oder Köpfen' ergibt. Hier ist eine Konstante, da wir vorhaben, für alle Experimente in der Population dieselbe Anzahl von Münzwürfen zu verwenden.p^=Yn n
Also ist .V(Yn)=(1n2)V(Y)=(1n2)(npq)=pq/n
Der Standardfehler für (eine Beispielstatistik) ist alsop^ pq/n−−−−√
quelle
$x$
ergibt .Ich denke, es gibt auch eine gewisse Verwechslung im ersten Beitrag zwischen Standardfehler und Standardabweichung. Die Standardabweichung ist der Quadratmeter der Varianz einer Verteilung. Standardfehler ist die Standardabweichung des geschätzten Mittelwerts einer Stichprobe von dieser Verteilung, dh die Streuung der Mittelwerte, die Sie beobachten würden, wenn Sie diese Stichprobe unendlich oft durchführen würden. Ersteres ist eine inhärente Eigenschaft der Distribution; Letzteres ist ein Maß für die Qualität Ihrer Schätzung einer Eigenschaft (des Mittelwerts) der Verteilung. Wenn Sie ein Experiment mit N Bernouilli-Versuchen durchführen, um die unbekannte Erfolgswahrscheinlichkeit abzuschätzen, ist die Unsicherheit Ihres geschätzten p = k / N, nachdem Sie k Erfolge gesehen haben, ein Standardfehler des geschätzten Anteils sqrt (pq / N) mit q = 1 -p. Die wahre Verteilung wird durch einen Parameter P charakterisiert, die wahre Erfolgswahrscheinlichkeit.
quelle