"Peakedness" einer verzerrten Wahrscheinlichkeitsdichtefunktion

11

Ich möchte die "Peakedness" und die "Schwere" des Schwanzes mehrerer Funktionen mit verzerrter Wahrscheinlichkeitsdichte beschreiben.

Die Merkmale, die ich beschreiben möchte, würden sie "Kurtosis" heißen? Ich habe nur das Wort "Kurtosis" gesehen, das für symmetrische Verteilungen verwendet wird.

pdf descriptive-statistics skewness kurtosis user1375871
quelle

15

In der Tat werden die Kurtosis-Maße typischerweise auf symmetrische Verteilungen angewendet. Sie können es auch für verzerrte berechnen, aber die Interpretation ändert sich, da dieser Wert variiert, wenn die Asymmetrie eingeführt wird. Tatsächlich sind diese beiden Konzepte schwer zu trennen. Kürzlich wurde in diesem Artikel ein schiefheitsinvariantes Maß für die Kurtosis vorgeschlagen .

Hohe Kurtosis ist mit Spitzenwerten und starkem Schwanz verbunden (sie wird auch als „Mangel an Schultern“ bezeichnet). In einem der Bände von Kendall und Stuart werden diese Themen ausführlich behandelt. Aber solche Interpretationen werden, wie Sie bemerken, im Allgemeinen in der Situation der Nahsymmetrie gegeben. In unsymmetrischen Fällen korreliert das standardisierte 4. Moment normalerweise stark mit dem Quadrat des standardisierten dritten Moments, sodass sie meistens ähnlich messen.

Glen_b -State Monica

In Anbetracht der besonderen Art und Weise, wie ich es in meinem früheren Kommentar formuliert habe, gilt dies sogar für symmetrische Verteilungen - das Quadrat des standardisierten dritten Moments der Stichprobe (Quadratmoment-Schiefe) korreliert sogar stark mit dem standardisierten vierten Moment der Stichprobe („Kurtosis“) sagen wir mal das normale.

Glen_b -Reinstate Monica

3

Wenn die Varianz als das zweite Moment definiert ist, die Schiefe als das dritte Moment und die Kurtosis als das vierte Moment , ist es möglich, die Eigenschaften eines weiten Bereichs symmetrischer und nicht symmetrischer Verteilungen zu beschreiben aus den Daten. $\mu_{2}$ $\mu_{3}$ $\mu_{4}$

Diese Technik wurde ursprünglich 1895 von Karl Pearson für die sogenannten Pearson-Verteilungen I bis VII beschrieben. Dies wurde von Egon S. Pearson (Datum ungewiss), wie er 1966 in Hahn und Shapiro veröffentlicht wurde, auf eine breite Palette symmetrischer, asymmetrischer und schwerer Schwanzverteilungen erweitert, darunter Uniform, Normal, Students-t, Lognormal, Exponential, Gamma, Beta, Beta J und Beta U. Aus der Tabelle von p. 197 von Hahn und Shapiro, und können verwendet werden, um Deskriptoren für Schiefe und Kurtosis zu erstellen als: $B_{1}$ $B_{2}$

$\mu_{3} = \sqrt {B_{1}\ \mu_{2}^{3}}$
$\mu_{4} = B_{2}\ \mu_{2}^{2}$

Wenn Sie nur einfache relative Deskriptoren wollten, ist die Schiefe durch Anwenden einer Konstanten $\mu_{2} = 1$ und die Kurtosis ist. $\sqrt {B_{1}}$ $B_{2}$

Wir haben versucht, dieses Diagramm hier zusammenzufassen, damit es programmiert werden kann, aber es ist besser, es in Hahn und Shapiro (S. 42-49,122-132,197) zu überprüfen. In gewissem Sinne schlagen wir ein wenig Reverse Engineering des Pearson-Diagramms vor, aber dies könnte eine Möglichkeit sein, zu quantifizieren, was Sie suchen.

AsymLabs
quelle

3

Das Hauptproblem hier ist, was ist "Peakedness"? Ist es eine Krümmung am Peak (2. Ableitung?) Muss es zuerst standardisiert werden? (Sie würden es denken, aber es gibt einen Strom von Literatur, der mit Proschan, Ann. Math. Statist. Volume 36, Number 6 (1965), 1703-1706 beginnt und die Peakedness auf eine Weise definiert, die normal mit geringerer Varianz ist. " Höhepunkt "). Oder ist es eine Wahrscheinlichkeitskonzentration innerhalb einer Standardabweichung des Mittelwerts, wie sie in Balanda und Macgillivray impliziert ist (The American Statistician, 1988, Vol 42, 111-119)? Sobald Sie sich für eine Definition entschieden haben, sollte es trivial sein, sie anzuwenden. Aber ich würde fragen: "Warum kümmert es dich?" Von welcher Relevanz ist "Peakedness", wie auch immer definiert?

Übrigens misst die Pearson-Kurtosis nur die Schwänze und misst keine der oben genannten "Peakedness" -Definitionen. Sie können die Daten oder die Verteilung innerhalb einer Standardabweichung des Mittelwerts beliebig ändern (wobei die Einschränkung Mittelwert = 0 und Varianz = 1 beibehalten wird), die Kurtosis kann sich jedoch nur innerhalb eines maximalen Bereichs von 0,25 ändern (normalerweise viel weniger). Sie können also die Verwendung von Kurtosis zur Messung der Peakedness für jede Verteilung ausschließen, obwohl Kurtosis tatsächlich ein Maß für die Schwänze für jede Verteilung ist, unabhängig davon, ob die Verteilung symmetrisch, asymmetrisch, diskret, kontinuierlich, diskret / kontinuierlich oder empirisch ist. Kurtosis misst Schwänze für alle Verteilungen und praktisch nichts über Peak (wie auch immer definiert).

Peter Westfall
quelle

1

A possible very practical approach could be calculate the ratio of the survival function of the distribution $\Pr\left(\tilde X \gt 1- \alpha \right)$ against the normal one, showing it is quite far greater. Another approach can be calculating the ratios of percentiles $w_1=\frac{\tilde{x_{99}}-\tilde{x_{50}}}{\tilde{x_{75}}-\tilde{x_{50}}}$ of the distribution $\tilde x$ under interest and dividing it against the normal one quantile values, $w_2=\frac{\tilde{\Phi_{99}}-\tilde{\Phi_{50}}}{\tilde{\Phi_{75}}-\tilde{\Phi_{50}}}$ , $\tau=\frac{w_1}{w_2}$ .

Giorgio Spedicato
quelle

0

I am not sure I get your understanding of peakedness and heaviness. Kurtosis means "Excess" in German, so it describes the "head" or "peak" of a distribution, describing whether it is very wide or very narrow. Wikipedia states that the "peakedness" is actually described by the "kurtosis", whereas peakedness does not to appear to be a real word and you should use the term "Kurtosis".

So I think you might have gotten everything right, the head is the Kurtosis, The "heaviness" of the tail might be the Skewness":

Here is how you find it:

a_{3} = \frac{Σ_{i = 1}^{N} (x_{i} - \bar{x})^{3}}{N * s_{x}^{3}}

$a_3 = \frac{\Sigma^{N}_{i=1}(x_i - \overline x)^3}{N * s^3_x}$

with s as the standard deviation for x.

The values indicate:

Negative Skew:

a_{3} < 0

$a_3 < 0$

Positive Skew:

a_{3} > 0

$a_3 > 0$

No Skew

a_{3} = 0

$a_3 = 0$

You can get a value for the kurtosis with:

a_{4} = \frac{Σ_{i = 1}^{N} (x_{i} - \bar{x})^{4}}{N * s_{x}^{4}}

$a_4 = \frac{\Sigma^{N}_{i=1}(x_i - \overline x)^4}{N * s^4_x}$

The values indicate:

Platycurtic:

a_{4} < 3

$a_4 < 3$

Leptocurtic:

a_{4} > 3

$a_4 > 3$

Normal:

a_{4} = 3.0

$a_4 = 3.0$

Did that help?

Johannes Hofmeister
quelle

3

I'm afraid this answer in its current form may be less than helpful due to errors in it. Skewness is a standard measure of asymmetry. It is not closely related to heaviness of tails: it is possible for the tails to be extremely heavy and the skewness to be zero (which is the case for any symmetric distribution, for instance). Please note, too, that it is impossible for

a_{4}

$a_4$ to be negative, so the second half of this answer makes little sense. (Perhaps you confused kurtosis with excess kurtosis?)

whuber

1

Thank you for clarifying. There might indeed be some errors in the formulas, I just copied them from the scripts they provide at uni. I oversaw the fact that a4 can't be negative.

Johannes Hofmeister

1

I looked up why my answer is wrong - it is a translational error, I apologize for that. My slides are all in German, mixing Kurtosis and Excess.

Johannes Hofmeister

@Peter As Peter Westfall keeps pointing out, your comment is incorrect: "peakedness" (of any mode), thought of vaguely as pointiness or height, has absolutely nothing to do with the tails of any distribution, nor is it measured by any finite combination of moments (such as the kurtosis). It may happen to be connected to heaviness of tails for a family of distributions, but that's a completely different matter.

whuber

-1

Kurtosis is definitely associated with the peakedness of the curve. I henceforth believe that you are really looking for kurtosis which does exist whether the distribution is symmetric or not. (user10525) has definitely said it right ! I hope your problem is resolved by now. Do share its outcome, all opinions are welcome.

Vani
quelle

1

I'm not sure how this constitutes a helpful answer beyond what was already written here. How about you expand more on kurtosis and peakedness of the curve?

Momo

Wanted to give clear cut clarification to the query. The discussion seemed to be confusing @Momo

Vani

"Peakedness" einer verzerrten Wahrscheinlichkeitsdichtefunktion

Antworten: