Warum geben Excel und WolframAlpha unterschiedliche Werte für die Schiefe an?

14

für die folgenden 3 Werte 222,1122,45444

WolframAlpha ergibt 0.706

Excel mit =SKEW(222,1122,45444)ergibt 1.729

Was erklärt den Unterschied?

Scott Weinstein
quelle
Handelt es sich bei dieser Frage um eine empirische oder möglicherweise nichtparametrische Schiefe oder um die Schätzung der Schiefe?
gwr

Antworten:

17

Sie verwenden verschiedene Methoden, um den Versatz zu berechnen. Durch Suchen in den Hilfeseiten nach skewness()innerhalb des R-Pakets werden folgende e1071Ergebnisse erzielt:

Joanes and Gill (1998) discuss three methods for estimating skewness:

Type 1:
g_1 = m_3 / m_2^(3/2). This is the typical definition used in many older textbooks.
Type 2:
G_1 = g_1 * sqrt(n(n-1)) / (n-2). Used in SAS and SPSS.
Type 3:
b_1 = m_3 / s^3 = g_1 ((n-1)/n)^(3/2). Used in MINITAB and BMDP.
All three skewness measures are unbiased under normality.

#Why are these numbers different?
> skewness(c(222,1122,45444), type = 2)
[1] 1.729690
> skewness(c(222,1122,45444), type = 1)
[1] 0.7061429

Hier ist ein Link zu dem Artikel, auf den verwiesen wird, wenn jemand die Berechtigungsnachweise hat, um ihn für weitere Diskussionen oder Schulungen zu erhalten: http://onlinelibrary.wiley.com/doi/10.1111/1467-9884.00122/abstract

Verfolgungsjagd
quelle
4
Es ist mathematisch nicht möglich, dass "alle drei Skewness-Maße unvoreingenommen sind", weil (offensichtlich) alle ihre Erwartungen unterschiedlich sind. Vielleicht meinst du asymptotisch unvoreingenommen?
Whuber
@whuber - Ich werde mich an [email protected] wenden, der das e1071Paket pflegt, um zu klären, was er speziell dort gemeint hat. Wenn mein Beitrag nicht klar war, kommt das von der Hilfeseite fürskewness()
Chase
3
g1
3
Der Punkt ist, dass G1=m3/m23/2, wo m2 und m3Im zweiten und dritten Moment geht es um den Mittelwert, ist die Bevölkerungsschiefe. Als Stichprobenstatistik wirft es dann ähnliche Probleme auf wie unvoreingenommene Schätzungen der Standardabweichung, die zu Korrekturen auf der Grundlage von führenndie einige Rechtfertigungen haben, aber immer noch keine unvoreingenommenen Schätzungen liefern. Aber ich denke, es ist nicht sehr hilfreich zu sagen, dass dies unvoreingenommene Schätzungen der Schiefe für symmetrische Verteilungen sind; Dies gilt auch für 0, das eine geringere Varianz aufweist, jedoch inkonsistent ist und für die Schätzung der Schiefe asymmetrischer Verteilungen unbrauchbar ist.
Henry
@onestop @Henry Ich stimme dir zu.
whuber