Ist ein fetter Schwanz gleich wie Schräg

7

Ich höre diese Begriffe immer wieder und es scheint, dass sich beide auf dasselbe beziehen: eine größere Wahrscheinlichkeit, dass ein Ereignis bei den Extremwerten einer Verteilung auftritt, weit weg vom Mittelwert (mehr als 3 Standardabweichungen entfernt)

Sieger
quelle

Antworten:

12

Die "Schwere" des Schwanzes bezieht sich darauf, wie schnell die Wahrscheinlichkeit abnimmt, wenn Sie sich vom Zentrum der Verteilung entfernen, während sich die Schiefe mit Symmetrie oder deren Fehlen befasst. Zum Beispiel ist die Exponentialverteilung verzerrt, wird aber als ziemlich leicht angesehen, während die Cauchy-Verteilung perfekt symmetrisch, aber schwer schwanzförmig ist.

dsaxton
quelle
7

Wie dsaxtron (+1) hervorhebt , bezieht sich die Schiefe auf Symmetrie oder Asymmetrie. Jede symmetrische Verteilung hat eine Schiefe von Null - egal wie fett ihre Schwänze sind. Dies liegt an der dritten Potenz in ihrer Definition, die es ermöglicht, Abweichungen in beiden Schwänzen auszugleichen.

Somit gibt es keine Beziehung zwischen Schiefe und Schwanzfett.

In diesem Zusammenhang empfehle ich jedoch dringend Westfall (2014), Kurtosis as Peakedness, 1905–2014. RIP in The American Statistician , der das verbreitete Missverständnis (das auch im Wikipedia-Artikel zu finden ist), dass Kurtosis irgendetwas mit "Peakedness" zu tun hat , äußerst gut entlarvt . Stattdessen misst die Kurtosis die Neigung zu Ausreißern, dh die Fettigkeit der Schwänze einer Verteilung. Dies liegt daran, dass die Kurtosis die vierte Potenz der Abweichungen vom Mittelwert verwendet, sodass sich positive und negative Schwänze nicht aufheben.

Stephan Kolassa
quelle
Summen. Ich habe der Frage gerade das Kurtosis- Tag hinzugefügt , da ich glaube, dass es hilfreich ist, die Angelegenheit zu verstehen ... und es stellt sich heraus, dass das Tag-Wiki denselben Fehler enthält. Muss das bearbeiten.
Stephan Kolassa
1
Kurtosis ist nicht Spitzigkeit, aber es auch nicht fett tailedness , wenn Sie es auf diese Weise zu definieren. Zum Beispiel hat (-1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1) eine große Kurtosis, obwohl nach -1 überhaupt kein "Schwanz" mehr vorhanden ist. Dies ist zum Beispiel ganz anders als beim Ende einer Potenzgesetzverteilung, bei der Ihre Wahrscheinlichkeitsdichte, sobald sie die von einem Gaußschen vorhergesagte überschreitet, dort bleibt.
Rex Kerr
1
Wellllllll, nur für bestimmte gängige Distributionen. Sogar diejenigen, die streng abnehmen, können unregelmäßig abnehmen, so dass die endgültige Form des Schwanzes die entgegengesetzte Antwort von der Kurtosis gibt. Ich würde eher sagen, dass Kurtosis eher auf die Fettigkeit der Schwänze hinweist, genauso wie Schiefe auf Asymmetrie hinweist. (Weil Sie natürlich in einer radikal asymmetrischen Verteilung kein drittes Moment haben können.) Das heißt, es sei denn, Sie definieren Fett als das, was die Kurtosis Ihnen sagt (z. B. Exponential ist "Fett" im Vergleich zu 0,9 Gauß + 0,1 Potenzgesetz).
Rex Kerr
1
Wie in Kendall und Stuart gezeigt, ist Moment-Kurtosis weder Peakedness noch Heavy-Tailness, obwohl sie mit beiden verbunden ist. Wie Moors (Moors JJA (1986) Die Bedeutung von Kurtosis: Darlington erneut untersucht. Der amerikanische Statistiker 40 (4) 283-284) weist darauf hin, dass Kurtosis eine monotone Funktion von Var ist (wobei, wenn X die Variable ist unter Berücksichtigung von - eine standardisierte Variable); Die Kurtosis entspricht dann der Variation von um . Infolgedessen wird eine niedrige Kurtosis manchmal als "Schultern" und eine hohe Kurtosis als "Mangel an Schultern" bezeichnet. (Z2)Z=(Xμ)/σXμ±σ
Glen_b -State Monica
1
Ja; und ursprünglich aus Yule & Kendall entwickelt, glaube ich. Aber trotzdem, in Band I der Advanced Theory of Statistics. Zumindest war es in der 2. und 3. Auflage meiner Erinnerung nach; Sie haben eine Tabelle, die zeigt, dass weder ein schwererer Schwanz noch ein höherer Peak notwendigerweise zu mehr Kurtosis führen. Es ist jedoch einige Jahrzehnte her, seit ich mir das angeschaut habe, daher ist meine Erinnerung an die Besonderheiten ihrer Gegenbeispiele verschwommen. Ich würde sagen, dass die Fähigkeit des Schwanzes, die Kurtosis zu beeinflussen, im Allgemeinen größer als der Peak ist, aber es ist mehr als nur der Schwanz.
Glen_b -State Monica
1

Entschuldigung, ich bin zu spät zu diesem Thread. In den Kommentaren wurden mehrere Gesichtspunkte zum Ausdruck gebracht, die Verwirrung über Ausreißer und Schwänze zum Ausdruck bringen.

Rex Kerrs Kommentar, dass Kurtosis kein Fettschwanz ist, ist falsch. Sein Gegenbeispiel ohne Ausreißer (und daher, wie er behauptet, ohne fetten Schwanz) ist . Ich werde diese Daten in die empirische Verteilung mit umwandeln und die überschüssige Kurtosis berechnen .(1,0,0,0,0,0,0,0,0,0,1)x=(1,0,1)p(x)=(1/11,9/11,1/11)k=2.5

Sein Kommentar ist, dass dieses Beispiel "große Kurtosis zeigt, obwohl sie keinen Schwanz hat".

Um dies näher zu beleuchten, vereinfachen wir das Beispiel. Betrachten Sie stattdessen die Bernoulli-Verteilung , . Es gibt noch weniger im Schwanz dieser Verteilung, aber die Kurtosis tendiert gegen unendlich, während gegen tendiert . Stellen Sie sich zum Beispiel vor, dass dies ein Modell für die Annahme ist, dass die Mondlandung mit gefälscht wurde . Ich denke, wir sind uns alle einig, dass die Person, die glaubt, dass die Mondlandung gefälscht war, ein "Ausreißer" ist. Die überschüssige Kurtosis dieser Verteilung bestätigt dies mit .x=(0,1)p(x)=(1p,p)p0p(x)=(.94,.06)k=11.7

Der Grad der "Ausreißer" kann durch Punkte charakterisiert werden : Hier hat die Person, die glaubt, die Mondlandung sei gefälscht, Punkte , ein ziemlicher Weg in den Schwanz der Verteilung.zzz=(1.06)/.06.94=3.95z

Wenn der Glaube an den Scherz seltener wäre (was laut Umfragen anscheinend nicht der Fall ist ), wie z. B. , hätte diese Person einen Wert von , was, wie alle zustimmen würden, ein Ausreißer ist: Wenn diese Daten aus einer Normalverteilung stammen würden, wäre die Wahrscheinlichkeit, eine Beobachtung von Standardabweichungen vom Mittelwert oder mehr zu sehen, so gering, dass sie als unmöglich bezeichnet werden könnte. Auch die überschüssige Kurtosis beträgt jetzt .0.1%zz=(1.001)/.001.999=31.6131.61k=995

Trotz der Tatsache, dass die Normalverteilung Schwänze hat, die sich bis ins Unendliche erstrecken, ist die Bernoulli-Verteilung für kleine wohl "schwerer" in dem Sinne, dass sie extreme Beobachtungen erzeugen kann, die weit über das hinausgehen, wozu die Normalverteilung fähig ist.p

Kurtosis ist per Definition der erwartete Wert der Werte, die jeweils auf die vierte Potenz angehoben werden. Wenn Sie extreme Punkte (Ausreißer) haben, haben Sie eine hohe Kurtosis.Zz

Es gibt unendlich viele Maße für die Schwanzextremität. Kurtosis ist ein Maß für die Schwanzextremität, das sich auf die Punkte konzentriert. Durch dieses Maß kann eine Verteilung mit endlicher Unterstützung schwerer sein als eine mit unendlicher Unterstützung.z

Diese Definition ist vollkommen logisch und wird durchaus angewendet. Der Grund, warum wir uns für Schwänze interessieren, ist, dass wir uns für Ausreißer interessieren. Die Normalverteilung erzeugt einfach keine Ausreißer 31 Standardabweichungen vom Mittelwert, wie es in der Praxis üblich ist. Die Bernoulli-Verteilung hingegen erzeugt solche Werte recht leicht.

Der Fokus auf Ausreißer wird durchaus angewendet, da statistische Verfahren aller Art von Ausreißern betroffen sind. Nehmen Sie zum Beispiel die Varianzschätzung: Ihre Genauigkeit hängt stark von der Kurtosis ab, da der Wert der Schätzung stark davon abhängt, ob sich Ausreißer in dieser bestimmten Stichprobe befinden oder nicht. Power-of-Mean-Tests werden auch von Ausreißern beeinflusst. Die Interpretation der Kurtosis als Maß für Ausreißer und nicht für Peak oder Center ist also nicht nur richtig, sondern stimmt auch mit statistischen Anwendungen überein.

Zurück zu Rex '"Gegenbeispiel" könnte er extremer werden, indem er , . Die überschüssige Kurtosis beträgt jetzt . Der Grund ist, dass die Antworten und jetzt extreme Ausreißer sind, Standardabweichungen vom Mittelwert. Diese Verteilung ist schwerer als die Normalverteilung in dem Sinne, dass sie gelegentlich Standardabweichungen vom Mittelwert ergibt.x=(1,0,1)p(x)=(.001,.998,.001)k=497+1122.422.4

Auch wenn Rex 'Gegenbeispiel und meine verbesserte Version davon nahe legen, dass eine höhere Kurtosis einer "Peaked" -Verteilung entspricht, gibt es einfache Beispiele, bei denen die Verteilung nicht mit derselben Kurtosis einen Peak erreicht. Nehmen wir zum Beispiel , . Diese Verteilung ist "U" -förmig, nicht spitz und es gibt gelegentlich Ausreißer. Die überschüssige Kurtosis beträgt , ähnlich wie bei meinem erweiterten Gegenbeispiel, und die extremsten Werte sind ebenfalls Standardabweichungen vom Mittelwert.x=(1000,2,1,0,+1,+2,+1000)p(x)=(.001,.25,.20,.098,.20,.25,.001)k=49622.3

Zusammenfassend Kurtosis macht den Schwanz (potentielle Ausreißer) der Verteilung messen, weil es der erwartete Wert ist . Wenn Sie einige große Werte haben, dann haben Sie eine große Kurtosis.Z4Z

In meinem TAS- Artikel gebe ich drei mathematische Theoreme an (für die es offensichtlich keine Gegenbeispiele geben kann) , um den Zusammenhang zwischen Kurtosis und Schwanz zu unterstützen. Meines Wissens gibt es keine Theoreme, die Kurtosis mit der Form des Peaks oder sogar mit dem Wahrscheinlichkeitsgehalt im Bereich verbinden. Wenn jemand einen solchen Satz hat, würde ich ihn gerne sehen.μ±σ

Peter Westfall
quelle
1
Wenn wir den Kommentar von @ RexKerr als durch das Konzept eines schweren Schwanzes oder eines langen Schwanzes motiviert verstehen , dann ist dies völlig gerechtfertigt. Die Kurtosis kann selbst für die leichtesten Verteilungen beliebig groß sein. Das sieht für mich nicht "fehlgeleitet" aus.
whuber
1
Es ist falsch in dem Sinne, warum wir uns aus praktischen Gründen um Schwänze kümmern, das heißt, dass wir uns um Ausreißer kümmern.
Peter Westfall
2
Oder vielleicht kümmern wir uns um Phänomene des Potenzgesetzes. Oder vielleicht über logarithmische Normalverteilungen. Oder möglicherweise über Student t-Verteilungen mit kleinen Freiheitsgraden, wenn wir ANOVA mit nur zwei oder drei Replikaten durchführen. Vielleicht beim Studium extremer Ereignisse wie Überschwemmungen und Finanzen. Oder Zeiten, in denen zufällige Spaziergänge wiederkehren. Ich bin sicher, Sie können auch an andere Anwendungen denken.
whuber
1
Danke whuber. Ausreißer sind in der Tat wichtig. Der Fokus, den viele auf den zentralen Teil der Verteilung in Bezug auf Kurtosis und nicht auf die Ausreißer gelegt haben, ist genau das Problem, auf das ich hinweisen wollte. Diese Interpretation von Kurtosis ähnelt dem Schwanz, mit dem der Hund wedelt: Ja, Sie können Kurtosis als Massenkonzentration innerhalb der Ausreißer verstehen, aber es ist sinnvoller und praktisch relevanter, Kurtosis als Ausreißer im Verhältnis zur Zentralmasse zu betrachten. Schließlich ist es ziemlich unzuverlässig, etwas in Bezug auf Ausreißer zu definieren. Die zentrale Masse ist jedoch stabil.
Peter Westfall