Angenommen, ich habe 2 Sätze:
Set A : Anzahl der Elemente , ,
Set B : Anzahl der Elemente , ,
Ich kann den kombinierten Mittelwert ( ) leicht finden, aber wie soll ich die kombinierte Standardabweichung finden?
standard-deviation
kype
quelle
quelle
Antworten:
Wenn Sie also nur zwei dieser Samples zu einem zusammenfassen möchten, haben Sie:
Dabei sind und Stichprobenmittel und und Stichprobenstandardabweichungen. ˉ y 2s1s2y¯1 y¯2 s1 s2
Um sie zu addieren, haben Sie:
Das ist nicht so einfach, da sich der neue Mittelwert vony¯ von y¯1 und y¯2 :
Die endgültige Formel lautet:
Für die üblicherweise verwendete Bessel-korrigierte (" Nenner") Version der Standardabweichung sind die Ergebnisse für die Mittelwerte wie zuvor, jedochn−1
Weitere Informationen finden Sie hier: http://en.wikipedia.org/wiki/Standard_deviation
quelle
Dies erstreckt sich offensichtlich auf Gruppen:K
quelle
Ich hatte das gleiche Problem: Wenn ich die Standardabweichung, die Mittelwerte und die Größen mehrerer Teilmengen mit leerem Schnittpunkt habe, berechne ich die Standardabweichung der Vereinigung dieser Teilmengen.
Ich mag die Antwort von sashkello und Glen_b ♦ , aber ich wollte einen Beweis dafür finden. Ich habe es so gemacht, und ich lasse es hier, falls es jemandem hilft.
So ist es das Ziel , das zu sehen in der Tat:
Schritt für Schritt:
Now the trick is to realize that we can reorder the sums: since each
and hence, continuing with the equality chain:
This been said, there is probably a simpler way to do this.
The formula can be extended tok subsets as stated before. The proof would be induction on the number of sets. The base case is already proven, and for the induction step you should apply a similar equality chain to the latter.
quelle
s
from the standard deviations, means and sizes of two subsets. In the formula there is no reference to the individual observations. In the proof there is, but its just a proof, and from my point of view, correct.