Was ist der Unterschied zwischen Varianz und Standardabweichung?

127

Ich habe mich gefragt, was der Unterschied zwischen der Varianz und der Standardabweichung ist.

Wenn Sie die beiden Werte berechnen, ist es klar, dass Sie die Standardabweichung aus der Varianz erhalten, aber was bedeutet das für die Verteilung, die Sie beobachten?

Warum brauchen Sie eigentlich eine Standardabweichung?

Le Max
quelle
12
Sie haben die Antwort wahrscheinlich schon bekommen. Dennoch hat dieser Link die einfachste und beste Erklärung. mathsisfun.com/data/standard-deviation.html
2
Die Standardabweichung ist nützlich, da sich der Wert in derselben Skala befindet wie die Daten, aus denen er berechnet wurde. Wenn Meter gemessen werden, ist die Standardabweichung Meter. Die Varianz wird im Gegensatz dazu in Quadratmetern angegeben.
Vladislavs Dovgalecs
Die Standardvariation kann vorurteilsfrei sein , die Standardabweichung jedoch nicht, da die Quadratwurzelfunktion nicht linear ist.
Daksh Gargas

Antworten:

85

Die Standardabweichung ist die Quadratwurzel der Varianz.

Die Standardabweichung wird in den gleichen Einheiten wie der Mittelwert ausgedrückt, während die Varianz in quadratischen Einheiten ausgedrückt wird. Für die Betrachtung einer Verteilung können Sie jedoch eine der beiden Einheiten verwenden, sofern Sie genau wissen, was Sie verwenden. Zum Beispiel ist eine Normalverteilung mit Mittelwert = 10 und sd = 3 genau dasselbe wie eine Normalverteilung mit Mittelwert = 10 und Varianz = 9.

Peter Flom
quelle
58
Ja, das ist der mathematische Weg, um diese beiden Parameter zu erklären, ABER was ist die logische Erklärung? Warum habe ich wirklich zwei Parameter eingegeben, um dasselbe zu zeigen (die Abweichung um das arithmetische Mittel) ...
Le Max
5
Beides braucht man nicht wirklich. Wenn Sie einen melden, müssen Sie den anderen nicht melden
Peter Flom
8
Wir brauchen beides: Standardabweichung ist gut für Interpretation und Berichterstattung. Für die Entwicklung der Theorie ist die Varianz besser.
kjetil b halvorsen
4
Der Vorteil der Berichterstattung über Standardabweichungen besteht darin, dass sie im Datenmaßstab verbleiben. Angenommen, eine Stichprobe von Erwachsenenhöhen ist in Metern, dann wird die Standardabweichung auch in Metern angegeben.
Vladislavs Dovgalecs
5
Var(Xi)=Var(Xi)
49

Du brauchst nicht beides. Sie haben jeweils unterschiedliche Zwecke. Die SD ist normalerweise nützlicher, um die Variabilität der Daten zu beschreiben, während die Varianz normalerweise mathematisch viel nützlicher ist. Beispielsweise hat die Summe der nicht korrelierten Verteilungen (Zufallsvariablen) auch eine Varianz, die die Summe der Varianzen dieser Verteilungen ist. Dies würde für den SD nicht zutreffen. Auf der anderen Seite bietet die SD die Möglichkeit, in Einheiten der ursprünglichen Variablen ausgedrückt zu werden.

John
quelle
24

Wenn John sich auf unabhängige Zufallsvariablen bezieht, wenn er "unabhängige Verteilungen" sagt, dann ist seine Antwort korrekt. Um Ihre Frage zu beantworten, können jedoch mehrere Punkte hinzugefügt werden:

  1. Mittelwert und Varianz sind die beiden Parameter, die eine Normalverteilung bestimmen.

  2. k

  3. z0t

  4. 68%195.4%299%3

  5. Die Fehlertoleranz wird als Vielfaches der Standardabweichung der Schätzung ausgedrückt.

  6. Varianz und Voreingenommenheit sind Messgrößen für die Unsicherheit in einer zufälligen Größe. Der mittlere quadratische Fehler für eine Schätzung entspricht der Varianz + der quadratischen Abweichung.

Michael Chernick
quelle
4
Sie sollten wahrscheinlich nicht "natürliche Parameter" sagen, die gemittelt durch Varianz und 1 geteilt durch Varianz sind: en.wikipedia.org/wiki/Natural_parameter
Neil G
σ
Sollte es in Punkt 3 nicht "Standardabweichung wird verwendet, um Statistiken zu standardisieren" sein, anstatt zu normalisieren?
Harry
15

Die Varianz eines Datensatzes misst die mathematische Streuung der Daten relativ zum Mittelwert. Obwohl dieser Wert theoretisch korrekt ist, ist es schwierig, ihn im realen Sinne anzuwenden, da die zur Berechnung verwendeten Werte zum Quadrat berechnet wurden. Die Standardabweichung gibt als Quadratwurzel der Varianz einen Wert an, der in den gleichen Einheiten wie die ursprünglichen Werte liegt, was das Arbeiten und die Interpretation im Zusammenhang mit dem Konzept der normalen Kurve erheblich erleichtert.

Hassan
quelle
Das macht einen tollen Job, um das Warum in einfachen Worten zu erklären .
GWG
3
Ein weiterer guter Punkt wäre, dass jede Metrik sd und var die Streuung der Variablen um den Mittelwert misst. Die Quadratwurzel der Varianz zu nehmen, um die Standardabweichung zu erhalten, könnte als ein Skalierungsfaktor angesehen werden, der angewendet wird, um die Metrik zurück in Einheiten der Variablen zu bringen.
Matt L.
6

In Bezug auf die Verteilung sind sie gleichwertig (aber offensichtlich nicht austauschbar), aber beachten Sie, dass sie in Bezug auf Schätzer nicht gleichwertig sind: Die Quadratwurzel einer Schätzung der Varianz ist KEIN (unverzerrter) Schätzer der Standardabweichung. Nur für eine mäßig große Anzahl von Stichproben (und abhängig von den Schätzern) nähern sich die beiden einander an. Für kleine Stichprobengrößen müssen Sie die parametrische Form der Verteilung kennen, die zwischen den beiden konvertiert werden soll. Diese kann leicht kreisförmig werden.

Quarz
quelle
4

Bei der Berechnung der Varianz haben wir die Abweichungen quadriert. Wenn die angegebenen Daten (Beobachtungen) in Metern angegeben sind, werden sie zu Quadratmetern. Hoffe, es ist nicht die richtige Darstellung über die Abweichungen. Also, wir haben wieder eine Quadratwurzel (SD), die nichts als SD ist.

g ravi
quelle