Gibt es normalisierte Entsprechungen zu Skewness und Kurtosis?

10

Was wäre das normalisierte Äquivalent zu Skewness, das dieselbe Einheit wie die Daten hätte? Was wäre das normalisierte Äquivalent zu Kurtosis? Idealerweise sollten diese Funktionen in Bezug auf die Daten linear sein, was bedeutet, dass, wenn alle Beobachtungen mit einem Faktor multipliziert würden n, die resultierende normalisierte Schiefe und Kurtosis mit demselben Faktor multipliziert würden n. Der Vorteil solcher normalisierten Äquivalente wäre, dass sie auf einem Standard-Box-and-Whisker-Plot überlagert werden können.

Ismael Ghalimi
quelle
Was für eine lustige Frage!
Alexis
Ich bin mir nicht sicher, wie aufschlussreich es wäre, diese in Grafiken darzustellen. Der Grund, warum wir Standardabweichungen veranschaulichen, ist, dass sie ein natürliches Maß für die Streuung der Daten liefern (wenn sie normal verteilt sind): 65% der Beobachtungen liegen innerhalb des Intervalls. Ich glaube nicht, dass es für den dritten und vierten Moment so natürliche visuelle Interpretationen gibt.
Ben Kuhn
2
Was versuchen Sie über Ihre Daten zu zeigen? Wenn es sich um ein bestimmtes qualitatives Verhalten der Verteilung handelt, ist eine Geigenhandlung vorzuziehen? Aber ja, es ist eine lustige Frage.
Ben Kuhn
Man kann ein Gefühl von Schiefe und Kurtosis bekommen, wenn man sich ein Histogramm ansieht, das die Verteilung des eigenen Datensatzes zeigt, aber es gibt eine sehr subjektive Wahrnehmung dieser Maßnahmen. Ich möchte sie auf zwei linearen Skalen darstellen, eine für die Schiefe parallel zur Achse des Box-and-Whisker-Diagramms, die andere orthogonal dazu. Dies könnte als separate Box dargestellt werden, die über der primären Box liegt. Je größer diese Box ist, desto verzerrter sind die Daten. Je breiter, desto spitzer (hohe Kurtosis).
Ismael Ghalimi
Und danke für den Link zum Violon-Plot. Es ist wirklich klug.
Ismael Ghalimi

Antworten:

10

Skewness-Maßnahmen sind bewusst einheitenlos .

Die übliche Momentschiefe ist ein standardisierter dritter Moment, .E[(Xμσ)3]

Wenn Sie aber nicht standardisieren, haben Sie ... was eindeutig in gewürfelten Einheiten ist .μ3=E[(Xμ)3]

Wenn Sie etwas in den gleichen Einheiten wie , müssen Sie die Kubikwurzel nehmen, genauso wie wir die Quadratwurzel der Varianz nehmen und etwas in den gleichen Einheiten der Originaldaten erhalten. (Beachten Sie jedoch, dass viele Pakete keine Kubikwurzeln mit negativen Zahlen haben. Sie müssen diese möglicherweise wie folgt berechnen: .)Xsign(Xμ)×|E(Xμ)3|1/3

Ich bin mir nicht sicher, wie nützlich das sein wird.

Bei einigen anderen Skewness-Maßen, wie den beiden Pearson-Skewness-Maßen, multiplizieren Sie einfach mit .σ

Bei Stichproben-Skewness-Messungen, bei denen und im Allgemeinen nicht bekannt sind, wie bei der Stichproben-Skewness, werden sie normalerweise durch ihre eigenen Stichprobenschätzungen ersetzt.σμ

Kurtosis folgt demselben Muster - für die Moment-Kurtosis müssten Sie die vierten Wurzeln des nicht standardisierten vierten Moments ziehen, um etwas zu erhalten, das mit den Daten skaliert.

Für einige der anderen Kurtosis-Maßnahmen müssten sie nur mit multipliziert werden .σ

Glen_b - Monica neu starten
quelle
10

Schiefe und Kurtosis sind Formmerkmale. Also, wenn ich Ihnen sagen , dass das Ding, ein Ball ist rund sollte es keine Rolle , was ein Radius der Sache ist. Es kann ein kleiner Ball oder ein großer Ball sein . Wenn ich dagegen eine kleine Kugel oder einen großen Würfel sage, beziehe ich mich auf die Größe des Objekts, nicht auf die Form.

In dieser Hinsicht ist die Standardabweichung die Größe der Verteilung, weshalb Schiefe und Kurtosis durch die Größe normalisiert werden. Man könnte auch sagen, dass die Standardabweichung zur Mechanik und die Schiefe und Kurtosis zur Geometrie gehört. Nein, wir brauchen sie daher nicht in Maßeinheiten der Variablen. Größe und Form sind getrennt. Ein großer und ein kleiner Ball sind gleich rund , dh die Größe spielt in diesem Fall keine Rolle :)

Aksakal
quelle
1

Wenn wir Vektoren bezeichnen, die in Region , nehmen wir an, dass der nullte und der erste Moment bereits normalisiert sind. Der zweite Moment wird mit berechnet Wenn wir also eine Diagonalisierung , können wir so definieren, dass normalisiert wird:RM2=RxxT|dx|M2=PΛ2PT

x=Λ1PTx
M2

M2ij=R(Λ1PTx)(Λ1PTx)T|dx|
=Λ1PT(RxxT|dx|)PΛ1
=Λ1PTPΛ2PTPΛ1=I

Geometrical meaning of the second moment is "orientation", which is justified by the fact that diagonalization normalizes the second moment. When skewness is calculated under this normalization, it is called Mardia's skewness.

Han JaeSeung StudentOfKyoto
quelle