Ich möchte die "Peakedness" und die "Schwere" des Schwanzes mehrerer Funktionen mit verzerrter Wahrscheinlichkeitsdichte beschreiben.
Die Merkmale, die ich beschreiben möchte, würden sie "Kurtosis" heißen? Ich habe nur das Wort "Kurtosis" gesehen, das für symmetrische Verteilungen verwendet wird.
pdf
descriptive-statistics
skewness
kurtosis
user1375871
quelle
quelle
Antworten:
Wenn die Varianz als das zweite Moment definiert ist, die Schiefe als das dritte Moment μ 3 definiert ist und die Kurtosis als das vierte Moment μ 4 definiert ist , ist es möglich, die Eigenschaften eines weiten Bereichs symmetrischer und nicht symmetrischer Verteilungen zu beschreiben aus den Daten.μ2 μ3 μ4
Diese Technik wurde ursprünglich 1895 von Karl Pearson für die sogenannten Pearson-Verteilungen I bis VII beschrieben. Dies wurde von Egon S. Pearson (Datum ungewiss), wie er 1966 in Hahn und Shapiro veröffentlicht wurde, auf eine breite Palette symmetrischer, asymmetrischer und schwerer Schwanzverteilungen erweitert, darunter Uniform, Normal, Students-t, Lognormal, Exponential, Gamma, Beta, Beta J und Beta U. Aus der Tabelle von p. 197 von Hahn und Shapiro, und B 2 können verwendet werden, um Deskriptoren für Schiefe und Kurtosis zu erstellen als:B1 B2
μ4=B2μ 2 2μ3=B1 μ32−−−−−√
μ4=B2 μ22
Wenn Sie nur einfache relative Deskriptoren wollten, ist die Schiefe durch Anwenden einer Konstanten √μ2=1 und die Kurtosis istB2.B1−−−√ B2
Wir haben versucht, dieses Diagramm hier zusammenzufassen, damit es programmiert werden kann, aber es ist besser, es in Hahn und Shapiro (S. 42-49,122-132,197) zu überprüfen. In gewissem Sinne schlagen wir ein wenig Reverse Engineering des Pearson-Diagramms vor, aber dies könnte eine Möglichkeit sein, zu quantifizieren, was Sie suchen.
quelle
Das Hauptproblem hier ist, was ist "Peakedness"? Ist es eine Krümmung am Peak (2. Ableitung?) Muss es zuerst standardisiert werden? (Sie würden es denken, aber es gibt einen Strom von Literatur, der mit Proschan, Ann. Math. Statist. Volume 36, Number 6 (1965), 1703-1706 beginnt und die Peakedness auf eine Weise definiert, die normal mit geringerer Varianz ist. " Höhepunkt "). Oder ist es eine Wahrscheinlichkeitskonzentration innerhalb einer Standardabweichung des Mittelwerts, wie sie in Balanda und Macgillivray impliziert ist (The American Statistician, 1988, Vol 42, 111-119)? Sobald Sie sich für eine Definition entschieden haben, sollte es trivial sein, sie anzuwenden. Aber ich würde fragen: "Warum kümmert es dich?" Von welcher Relevanz ist "Peakedness", wie auch immer definiert?
Übrigens misst die Pearson-Kurtosis nur die Schwänze und misst keine der oben genannten "Peakedness" -Definitionen. Sie können die Daten oder die Verteilung innerhalb einer Standardabweichung des Mittelwerts beliebig ändern (wobei die Einschränkung Mittelwert = 0 und Varianz = 1 beibehalten wird), die Kurtosis kann sich jedoch nur innerhalb eines maximalen Bereichs von 0,25 ändern (normalerweise viel weniger). Sie können also die Verwendung von Kurtosis zur Messung der Peakedness für jede Verteilung ausschließen, obwohl Kurtosis tatsächlich ein Maß für die Schwänze für jede Verteilung ist, unabhängig davon, ob die Verteilung symmetrisch, asymmetrisch, diskret, kontinuierlich, diskret / kontinuierlich oder empirisch ist. Kurtosis misst Schwänze für alle Verteilungen und praktisch nichts über Peak (wie auch immer definiert).
quelle
A possible very practical approach could be calculate the ratio of the survival function of the distributionPr(X~>1−α) against the normal one, showing it is quite far greater. Another approach can be calculating the ratios of percentiles w1=x99~−x50~x75~−x50~ of the distribution x~ under interest and dividing it against the normal one quantile values, w2=Φ99~−Φ50~Φ75~−Φ50~ , τ=w1w2 .
quelle
I am not sure I get your understanding of peakedness and heaviness. Kurtosis means "Excess" in German, so it describes the "head" or "peak" of a distribution, describing whether it is very wide or very narrow. Wikipedia states that the "peakedness" is actually described by the "kurtosis", whereas peakedness does not to appear to be a real word and you should use the term "Kurtosis".
So I think you might have gotten everything right, the head is the Kurtosis, The "heaviness" of the tail might be the Skewness":
Here is how you find it:
with s as the standard deviation for x.
The values indicate:
Negative Skew:
Positive Skew:
No Skew
You can get a value for the kurtosis with:
The values indicate:
Platycurtic:
Leptocurtic:
Normal:
Did that help?
quelle
Kurtosis is definitely associated with the peakedness of the curve. I henceforth believe that you are really looking for kurtosis which does exist whether the distribution is symmetric or not. (user10525) has definitely said it right ! I hope your problem is resolved by now. Do share its outcome, all opinions are welcome.
quelle