Wie hängt die Kurtosis einer Verteilung mit der Geometrie der Dichtefunktion zusammen?

12

Die Kurtosis ist die Messung der Höhe und Ebenheit einer Verteilung. Die Dichtefunktion der Verteilung kann, sofern vorhanden, als Kurve betrachtet werden und weist geometrische Merkmale (wie Krümmung, Konvexität usw.) auf, die mit ihrer Form zusammenhängen.

Ich frage mich also, ob die Kurtosis einer Verteilung mit einigen geometrischen Merkmalen der Dichtefunktion zusammenhängt, die die geometrische Bedeutung der Kurtosis erklären können.

Tim
quelle
Ich bitte um eine Beziehung in der Formel zu einer geometrischen Größe der Dichtekurve, nicht nur zu der vagen Bedeutung, auf die ich in meinem Beitrag hingewiesen habe. Oder es ist in Ordnung, nur eine Erklärung zu haben, warum Kurtosis die geometrische Bedeutung hat
Tim
@ Peter Das ist weit von der Wahrheit entfernt. Die Geometrie des PDF-Diagramms kann nahezu beliebig geändert werden, ohne dass bestimmte (endliche) Momente geändert werden müssen.
Whuber
Die eng verwandte Frage unter stats.stackexchange.com/questions/25010/… legt nahe, wie die richtige Antwort auf diese Frage aussehen sollte.
Whuber
@whuber obwohl ich zustimme und mich für dieses Beispiel bedanke, frage ich mich auch, ob es nicht mehr über die bemerkenswerte Eigenschaft dieser bestimmten PDF-Familie aussagt als über Kurtosis im Allgemeinen.
user603
@ user603 Das ist eine gute Sache, sich zu wundern. Die Aussage bezieht sich jedoch nicht auf diese bestimmte Familie: Es kommt lediglich vor, dass für die logarithmische Verteilung eine explizite Darstellung einer Klasse alternativer PDFs mit den gleichen Augenblicken erstellt werden kann. Es ist etwas Besonderes, dass alle Momente gleich sind, aber es ist nicht schwer, die meisten Verteilungen auf eine Weise zu stören, die eine begrenzte Anzahl ihrer Momente festlegt. (Für bestimmte diskrete Distributionen wie die Bernoulli ist es
schwierig

Antworten:

17

Die Momente einer kontinuierlichen Verteilung und Funktionen von ihnen wie die Kurtosis sagen nur sehr wenig über den Graphen seiner Dichtefunktion aus.

Betrachten Sie beispielsweise die folgenden Grafiken.

Bildbeschreibung hier eingeben

Jedes von diesen ist der Graph einer nicht negativen Funktion, die in integriert ist : Sie sind alle PDFs. Darüber hinaus haben sie alle genau die gleichen Momente - jede letzte unendliche Anzahl von ihnen. So teilen sie eine gemeinsame Kurtosis (was gleich geschieht - 3 + 3 e 2 + 2 e 3 + e 4 ) .13+3e2+2e3+e4

Die Formeln für diese Funktionen sind

fk,s(x)=12πxexp(12(log(x))2)(1+ssin(2kπlog(x))

für - 1 s 1 , und k Z .x>0, 1s1,kZ.

Die Abbildung zeigt Werte von links s und oben die Werte von k an. Die linke Spalte zeigt das PDF für die Standardlognormalverteilung.sk

In Übung 6.21 in Kendalls Advanced Theory of Statistics (Stuart & Ord, 5. Auflage) wird der Leser gebeten zu zeigen, dass alle dieselben Momente haben.

Man kann jedes PDF auf ähnliche Weise modifizieren , um ein anderes PDF mit einer radikal anderen Form zu erstellen, jedoch mit demselben zweiten und vierten zentralen Moment (etwa), die daher dieselbe Kurtosis haben würden. Allein aus diesem Beispiel sollte klar hervorgehen, dass Kurtosis kein leicht zu interpretierendes oder intuitives Maß für Symmetrie, Unimodalität, Bimodalität, Konvexität oder eine andere bekannte geometrische Charakterisierung einer Kurve ist.

Funktionen von Momenten (und Kurtosis als Sonderfall) beschreiben daher nicht die geometrischen Eigenschaften des Diagramms des PDF. Das macht intuitiv Sinn: Denn ein PDF repräsentiert die Wahrscheinlichkeit mittels Fläche darstellt, können wir die Wahrscheinlichkeitsdichte fast frei von einem Ort zum anderen verschieben, wodurch sich das Erscheinungsbild des PDF radikal ändert und eine endliche Anzahl von vordefinierten Momenten festgelegt wird.

whuber
quelle
1
"Allein anhand dieses Beispiels sollte es überaus klar sein ... jede andere vertraute geometrische Charakterisierung einer Kurve." Ich verstehe, was Sie meinen, aber hier gibt es Grund für vernünftige Abweichungen in der Auslegung. Eine andere Interpretation ist die von Darlington, die zeigt, wie ausgehend von einer symmetrischen Verteilung durch Bewegen einer Masse an bestimmten Punkten die Kurtosis erhöht / verringert wird (ebenfalls kein Widerspruch zu Ihrem Beispiel, nur ein „positiveres“ Verständnis).
user603
1
@ user603 Ich bin nicht anderer Meinung, aber ich denke, dass der "positive" Ansatz die ganz besonderen Annahmen übersieht, die implizit gemacht werden, damit es überhaupt funktioniert. Man könnte auch mit dem Diagramm eines extrem asymmetrischen PDF beginnen, dessen Schiefe Null ist (es ist nicht schwer, sie zu konstruieren). Dieser positive Ansatz beschreibt also lediglich, was mit bestimmten, sehr speziellen PDFs passiert, wenn die Masse bewegt wird. Obwohl dies für die Intuition sehr nützlich sein kann, scheint es für die vorliegende Frage keine logische Bedeutung zu haben.
Whuber
1
Ich stimme für die Schiefe (und für Ihre Antwort im Allgemeinen). Aber die Kurtosis hat als Funktion ein Minimum. Das macht die Sache etwas interessanter.
user603
1
@ user603 Danke; Das ist eine aufschlussreiche Unterscheidung. Ich denke nicht, dass es die gegenwärtigen Schlussfolgerungen in einer wichtigen Weise ändert, aber es hilft sicherlich der Intuition und weist auf einen wichtigen Unterschied zwischen geraden und ungeraden Momenten hin.
Whuber
6

Bei symmetrischen Verteilungen (für die gerade zentrierte Momente von Bedeutung sind) misst Kurtosis ein geometrisches Merkmal des zugrunde liegenden PDF. Es ist nicht wahr, dass Kurtosis die Höhe einer Verteilung misst (oder im Allgemeinen damit zusammenhängt). Die Kurtosis misst vielmehr, wie weit die zugrunde liegende Verteilung von der Symmetrie entfernt ist und bimodal ist (algebraisch hat eine perfekt symmetrische und bimodale Verteilung eine Kurtosis von 1, was dem kleinstmöglichen Wert entspricht, den die Kurtosis haben kann) [0].

Kurz gesagt [1], wenn Sie Folgendes definieren:

k=E(xμ)4/σ4

mit E(X)=μ,V(X)=σ2 , dann

k=V(Z2)+11

für Z=(Xμ)/σ .

Dies impliziert, dass als ein Maß für die Dispersion von Z 2 angesehen werden kannkZ2 um seine Erwartung 1 gesehen werden kann. Mit anderen Worten, wenn Sie eine geometrische Interpretation der Varianz und der Erwartung haben, folgt die der Kurtosis.

[0] RB Darlington (1970). Ist Kurtosis wirklich "Peakedness?". Der amerikanische Statistiker, Vol. 24, Nr. 2.

[1] JJA Moors (1986). Die Bedeutung von Kurtosis: Darlington Reexamined. The American Statistician, Band 40, Ausgabe 4.

user603
quelle
1
Überall, wo du "bimodal" schreibst, meinst du vielleicht "unimodal"?
Whuber
1
Ja, diese Beispiele funktionieren für symmetrische Verteilungen. Eine explizite könnte aus den pseudolognormalen Familien konstruiert werden: Nimm eine dieser (unendlich modalen) pdfs mit einem Mittelwert von μ und definiere ein neues pdf als g ( x ) = ( f ( x ) + f ( 2 μ - x ) ) / 2. Indem Sie eine kleine Menge g mit einer Minimum-Kurtosis-Verteilung einmischen, stellen Sie fest, dass es Verteilungen mit unendlich vielen Modi gibt, deren Kurtosis beliebig nahe am Minimum-Wert von 1 liegtfμg(x)=(f(x)+f(2μx))/2.g1. So sagt zumindest die Kurtosis überhaupt nichts über die Bimodalität aus. Da dies nicht der Fall ist, beschreibt es genau welche geometrische Eigenschaft des PDFs?
Whuber
1
Kurtosis zeigt keine Bimodalität an, außer in dem extremen Fall, in dem sie nahe ihrem Minimum ist, wo sie etwas anzeigt, das der Zwei-Punkt-Verteilung mit gleicher Wahrscheinlichkeit ähnlich ist. Sie können bimodale Verteilungen mit jedem möglichen Wert von Kurtosis haben. Beispiele finden Sie unter ncbi.nlm.nih.gov/pmc/articles/PMC4321753 .
Peter Westfall
1
Ja; Siehe das Papier, das ich verlinkt habe. Der erste Satz von DeCarlos Abstract ist absolut falsch. Wenn Sie meine Arbeit nicht lesen möchten, finden Sie hier die Mathematik: Nehmen Sie eine symmetrische bimodale Verteilung und mischen Sie sie mit einer viel breiteren symmetrischen Verteilung mit demselben Median wie die bimodale. Die Mischung ist symmetrisch und bimodal für kleine p . Durch zwicken die breitere Verteilung und das Mischen , können Sie den Kurtosis Bereich bis ins Unendliche machen. Mit .5N (-1, v) + .5N (1, v) können Sie die Kurtosis so klein machen, wie Sie möchten, und dabei v 0 lassen . Symmetrische und bimodale PDFS sind für alle Kurtosis einfach zu konstruieren. pv0
Peter Westfall
5

[Hinweis: Dies wurde als Antwort auf eine andere Frage vor Ort geschrieben. Die Antworten wurden auf die vorliegende Frage zusammengefasst. Aus diesem Grund scheint diese Antwort auf eine anders formulierte Frage zu antworten. Hier sollte jedoch ein Großteil des Beitrags relevant sein.]

Kurtosis misst die Form von Verteilungen nicht wirklich. In einigen Verbreitungsfamilien kann man vielleicht sagen, dass es die Form beschreibt, aber im Allgemeinen sagt die Kurtosis nicht viel über die tatsächliche Form aus. Die Form wird von vielen Dingen beeinflusst, einschließlich Dingen, die nichts mit Kurtosis zu tun haben.

Wenn ein Bild nach Kurtosis sucht, werden einige Bilder wie dieses angezeigt:

p

die stattdessen eine sich ändernde Varianz zu zeigen scheinen, anstatt die Kurtosis zu erhöhen. Zum Vergleich hier sind drei normale Dichten, die ich gerade mit R mit verschiedenen Standardabweichungen gezeichnet habe:

Bildbeschreibung hier eingeben

Wie Sie sehen, sieht es fast identisch mit dem vorherigen Bild aus. Diese haben alle genau die gleiche Kurtosis. Im Gegensatz dazu ist hier ein Beispiel, das wahrscheinlich näher an dem ist, was das Diagramm angestrebt hat

Bildbeschreibung hier eingeben

Die grüne Kurve ist sowohl spitzer als auch schwerer (obwohl diese Anzeige nicht gut geeignet ist, um zu sehen, wie viel schwerer der Schwanz tatsächlich ist). Die blaue Kurve ist weniger spitz und hat sehr leichte Schwänze (in der Tat hat sie darüber hinaus überhaupt keine Schwänze)6 Standardabweichungen vom Mittelwert).

Dies ist normalerweise gemeint, wenn man über Kurtosis spricht, die die Form der Dichte anzeigt. Kurtosis kann jedoch subtil sein - es muss nicht so funktionieren.

Beispielsweise kann bei einer gegebenen Varianz tatsächlich eine höhere Kurtosis mit einem niedrigeren Peak auftreten.

Man muss sich auch der Versuchung bewusst sein (und in einigen Büchern heißt es offen), dass eine Null-Überschuss-Kurtosis Normalität impliziert. Es gibt Verteilungen mit überschüssiger Kurtosis 0, die nicht normal sind. Hier ist ein Beispiel:

dgam 2.3

Dies verdeutlicht in der Tat auch den vorherigen Punkt. Ich könnte leicht eine ähnlich aussehende Verteilung mit einer höheren Kurtosis als die normale konstruieren, die aber im Zentrum immer noch Null ist - ein völliges Fehlen eines Peaks.

Es gibt eine Reihe von Beiträgen vor Ort, die die Kurtosis näher beschreiben. Ein Beispiel ist hier .

Glen_b - Setzen Sie Monica wieder ein
quelle
Aber ich habe es nicht gesagt? Das Buch sagt es?
Stat Tistician
Ich weiß das. Ich habe nie gesagt, dass du es gesagt hast. Wie würden Sie vorschlagen, auf offensichtlich falsche Aussagen zu antworten, nach denen Sie fragen? Tu einfach so, als wären sie nicht falsch?
Glen_b -Reinstate Monica
1
@ Glen_b Die Bilder sind nicht aus dem Buch. Das Buch enthält keine Illustrationen. Ich habe die Google-Bildersuche für diese Illustrationen verwendet.
Stat Tistician
2
Einige Autoren schreiben Kurtosis als Peakedness und andere als Tail Weight, aber die skeptische Interpretation, dass Kurtosis das ist, was Kurtosis misst, ist die einzige absolut sichere Geschichte. Zahlenbeispiele von Irving Kaplansky (1945) allein belegen, dass Kurtosis keine eindeutige Interpretation trägt. (Kaplanskys Artikel ist einer der wenigen, die er Mitte der 40er Jahre über Wahrscheinlichkeit und Statistik geschrieben hat. Er ist viel besser als angesehener Algebraist bekannt.) Vollständiger Verweis und mehr unter stata-journal.com/sjpdf.html?articlenum=st0204
Nick Cox
1
Es gibt Bücher und Veröffentlichungen, in denen behauptet wird, Kurtosis sei Peakedness, so dass mein erster Satz korrekt bleibt und als Aussage darüber, was in der Literatur steht, unterstützt werden kann. Entscheidender ist, wie man Kaplanskys Beispiele und Argumente betrachtet.
Nick Cox
3

μ±σ Bereichs) kann die Geometrie einen unendlichen Peak, einen flachen Peak oder bimodale Peaks aufweisen, sowohl in Fällen, in denen die Kurtosis unendlich ist, als auch in Fällen, in denen die Kurtosis geringer ist der Normalverteilung. Kurtosis misst nur das Schwanzverhalten (Ausreißer). Siehe https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4321753/

Edit 23.11.2008: Seit ich diesen Beitrag geschrieben habe, habe ich einige geometrische Perspektiven zur Kurtosis entwickelt. Eine davon ist, dass überschüssige Kurtosis in der Tat geometrisch in Form von Abweichungen von der erwarteten 45-Grad-Linie in den Endpunkten des normalen Quantil-Quantil-Diagramms dargestellt werden kann. Siehe Zeigt dieses QQ-Diagramm eine leptokurtische oder platykurtische Verteilung an?

Eine andere (vielleicht eher physikalische als geometrische) Interpretation der Kurtosis ist, dass die Kurtosis als der Punkt des Gleichgewichts der Verteilung visualisiert werden kann pV(v), wo V={(X-μ)/σ}4. Beachten Sie, dass (nicht übermäßige) Kurtosis vonX entspricht E(V). Somit ist die Verteilung vonV Guthaben bei der Kurtosis von X.

Ein weiteres Ergebnis, das diese Geometrie in der zeigt μ±σDie Reichweite ist für die Kurtosis nahezu irrelevant. Betrachten Sie das PDF eines WohnmobilsX having finite fourth moment. (Thus the result applies to all empirical distributions.) Replace the mass (or geometry) within the μ±σ range arbitrarily to get a new distribution, but keep the mean and standard deviation of the resulting distribution equal to μ and σ of the original X. Then the maximum difference in kurtosis for all such replacements is 0.25. On the other hand, if you replace the mass outside the μ±σ range, keeping the center mass as well as μ, σ fixed, the difference in kurtosis is unbounded for all such replacements.

Peter Westfall
quelle
3
Rather than just continuing to refer people to a paper in most of your posts, would you mind summarizing the arguments here? See the help here under "always provide context for links", in particular where it says "always quote the important part". It's not necessarily to literally quote it where the argument is extensive, but at least a summary of the argument is needed. You just make a couple of sweeping statements and then link to a paper. The statement that kurtosis measures tail behavior is (absent context) misleading (demonstrably so)
Glen_b -Reinstate Monica
2
... but it's impossible to disagree with arguments you don't present here, and perhaps arrive at a more nuanced conclusion.
Glen_b -Reinstate Monica
My arguments are clearly laid out here: en.wikipedia.org/wiki/… Comments welcome! BTW, kurtosis IS a measure of tail weight, just not the same as others that have been considered. It measures tail weight via E(Z^4), which is a measure of tail weight since the values |Z|<1 contribute so little to it. By the same logic, E(Z^n), for higher even powers n, are also tail weight measures.
Peter Westfall
Hi Peter, Please visit stats.stackexchange.com/help/merging-accounts to merge your accounts so that you can modify your old posts.
whuber
3

A different kind of answer: We can illustrate kurtosis geometrically, using ideas from http://www.quantdec.com/envstats/notes/class_06/properties.htm: graphical moments.

Start with the definition of kurtosis:

k=E(Xμσ)4=(xμσ)4f(x)dx
where f is the density of X, μ,σ2 respectively expectation and variance. The nonnegative function under the integral sign integrates to the kurtosis, and gives contribution to kurtosis from around x. We can call it the kurtosis density, and plotting it shows the kurtosis graphically. (Note that in this post we are not using the excess kurtosis ke=k3 at all).

In the following I will show a plot of graphical kurtosis for some symmetric distributions, all centered at zero and scaled to have variance 1.

visual kurtosis for some symmetric distributions

Note the virtual absence of contribution to the kurtosis from the center, showing that kurtosis does not have much to do with "peakedness".

kjetil b halvorsen
quelle
1
Exactly right. The areas under the curves you show from -1 to +1 are between 0 and 1 for all distributions, and are between 0 and 0.5 for all continuous distributions for which the density of Z2 is decreasing on the [0,1] range. Those two theorems are proven in my paper ncbi.nlm.nih.gov/pmc/articles/PMC4321753 . A third theorem proven therein is that, for any sequence of distributions for which kurtosis tends to infinity, the ratio of the area under the range from b to +b to kurtosis tends to zero, for every fixed b.
Peter Westfall