Es gibt mehrere zusammenfassende Statistiken. Wenn Sie die Streuung einer Verteilung beschreiben möchten, können Sie beispielsweise die Standardabweichung oder den Gini-Koeffizienten verwenden .
Ich weiß, dass die Standardabweichung auf der zentralen Tendenz basiert, dh der Abweichung vom Mittelwert, und der Gini-Koeffizient eine allgemeine Messung der Dispersion. Ich weiß auch, dass der Gini-Koeffizient eine Unter- und Obergrenze hat [0 1] und die Standardabweichung nicht . Diese Eigenschaften sind gut zu wissen, aber welche Erkenntnisse kann die Standardabweichung geben, die der Gini nicht kann, und umgekehrt? Wenn ich mich für eine der beiden entscheiden müsste, was sind die Vorteile einer Verwendung gegenüber einer anderen, wenn es darum geht, informativ und aufschlussreich zu sein?
quelle
Antworten:
Zwei Dinge zu beachten
Der Gini ist skalierungsunabhängig, während sich der SD in den Originaleinheiten befindet
Angenommen, wir haben ein Maß, das oben und unten begrenzt ist. SD nimmt seinen Maximalwert an, wenn sich an jeder Grenze halbe Messungen befinden, während Gini das Maximum annimmt, wenn sich eine an einer Grenze befindet und der Rest an der anderen.
quelle
Der Gini-Koeffizient ist skalierungsinvariant und begrenzt, die Standardabweichung invariant zu einer Verschiebung und unbegrenzt, sodass sie nur schwer direkt zu vergleichen sind. Jetzt können Sie eine skaleninvariante Version der Standardabweichung definieren, indem Sie durch den Mittelwert (Variationskoeffizient) dividieren.
Der Gini-Index basiert jedoch immer noch auf Werten, der zweite auf quadratischen Werten, sodass Sie erwarten können, dass der zweite stärker von Ausreißern beeinflusst wird (übermäßig niedrige oder hohe Werte). Dies kann in gefunden werden Maßnahmen zur Einkommensungleichheit , F De Maio, 2007:
Wenn Sie also keine nahezu Gaußsche Verteilung charakterisieren möchten, wenn Sie eine Sparsity messen möchten, verwenden Sie den Gini-Index. Wenn Sie die Sparsity zwischen verschiedenen Modellen fördern möchten, können Sie ein solches Normverhältnis ausprobieren.
Zusätzliche Vorlesung: Ginis mittlerer Unterschied: ein überlegenes Maß für die Variabilität für nicht normale Verteilungen , Shlomo Yitzhaki, 2003, dessen Zusammenfassung von Interesse sein könnte:
quelle
Die Standardabweichung hat eine Skala (z. B. ° K, Meter, mmHg, ...). Normalerweise beeinflusst dies unser Urteil über seine Größe. Daher bevorzugen wir eher den Variationskoeffizienten oder sogar (bei endlichen Stichproben) den Standardfehler.
quelle