Kann jemand ein Beispiel für eine unimodale Verteilung anbieten, die eine Neigung von Null hat, aber nicht symmetrisch ist?

31

Im Mai 2010 Wikipedia Benutzer hinzugefügt Mcorazao einen Satz zu dem Schiefe Artikel , dass „Ein Wert von Null zeigt an, dass die Werte relativ gleichmäßig auf beiden Seiten der mittleren verteilt, in der Regel , aber nicht notwendigerweise eine symmetrische Verteilung impliziert.“ Die Wiki-Seite enthält jedoch keine tatsächlichen Beispiele für Distributionen, die gegen diese Regel verstoßen. Googeln "Beispiel asymmetrische Verteilungen mit Null-Schiefe" gibt auch keine wirklichen Beispiele, zumindest in den ersten 20 Ergebnissen.

Unter Verwendung der Definition, dass der Versatz aus und dem R berechnet wird FormelE[(X-μσ)3]

sum((x-mean(x))^3)/(length(x) * sd(x)^3)

Ich kann eine kleine, willkürliche Verteilung konstruieren, um die Schiefe niedrig zu halten. Zum Beispiel die Verteilung

x = c(1, 3.122, 5, 4, 1.1) 

ergibt einen von . Dies ist jedoch eine kleine Stichprobe, und außerdem ist die Abweichung von der Symmetrie nicht groß. Ist es also möglich, eine größere Verteilung mit einem Peak zu konstruieren, der stark asymmetrisch ist, aber immer noch eine Schiefe von nahezu Null aufweist?-5,6494710-5

Andy McKenzie
quelle
3
Soll die Verteilung unimodal sein oder nicht? Der Titel sagt das, aber der Text erwähnt diesen Punkt kaum.
Dilip Sarwate
@Dilip Ja, ich würde es interessanter finden, wenn die Verteilung unimodal wäre, da die Schiefe als zentraler Moment ansonsten eigentlich keinen Sinn ergibt.
Andy McKenzie

Antworten:

28

Betrachten Sie diskrete Verteilungen. Eine, die auf Werten x 1 , x 2 , , x k unterstützt wird, wird durch nicht negative Wahrscheinlichkeiten p 1 , p 2 , , p k unter der Bedingung bestimmt, dass (a) sie sich zu 1 und (b) addieren. Der Skewness-Koeffizient ist gleich 0 (was dem dritten zentralen Moment entspricht, das Null ist). Damit bleiben k - 2 Freiheitsgrade (im gleichungslösenden Sinne, nicht im statistischen!). Wir können hoffen, Lösungen zu finden, die unimodal sind.kx1,x2,,xkp1,p2,,pkk-2

Um die Suche nach Beispielen zu vereinfachen, habe ich nach Lösungen gesucht, die auf einem kleinen symmetrischen Vektor mit einem eindeutigen Modus bei 0 , Mittelwert Null und Versatz Null basieren . Eine solche Lösung ist ( p 1 , ... , p 7 ) = ( 1396 , 3286 , 9586 , 47386 , 8781 , 3930 ,x=(-3,-2,-1,0,1,2,3)0 .(p1,,p7)=(1396,3286,9586,47386,8781,3930,1235)/75600

Wahrscheinlichkeitsfunktion

Sie können sehen, dass es asymmetrisch ist.

Hier ist eine offensichtlich asymmetrische Lösung mit (was asymmetrisch ist) und p = ( 1 , 18 , 72 , 13 , 4 ) / 108 :x=(3,1,0,1,2)p=(1,18,72,13,4)/108

Wahrscheinlichkeitsfunktion 2

Jetzt ist klar, was los ist: Weil der Mittelwert gleich , tragen die negativen Werte ( - 3 ) 3 = - 27 und 18 × ( - 1 ) 3 = - 18 zum dritten Moment bei, während die positiven Werte 4 × 2 3 = beitragen 32 und 13 × 1 3 = 13 , wobei die negativen Beiträge exakt ausgeglichen werden. Wir können eine symmetrische Verteilung um 0 annehmen , wie z. B. x =0(3)3=2718×(1)3=184×23=3213×13=130 mit p = ( 1 , 4 , 1 ) / 6 , und verschieben Sie eine kleine Masse von + 1 nach + 2 , eine kleine Masse von + 1 nach - 1 und eine kleine Menge Masse bis zu - 3 , wobei der Mittelwert bei 0 und die Schiefe bei 0 bleibenx=(-1,0,1)p=(1,4,1)/6+1+2+11300ebenso, während eine Asymmetrie erzeugt wird. Der gleiche Ansatz funktioniert, um den Mittelwert Null und die Schiefe Null einer kontinuierlichen Verteilung beizubehalten und sie gleichzeitig asymmetrisch zu machen. Wenn wir die Massenverschiebung nicht zu aggressiv angehen, bleibt sie unimodal.


Bearbeiten: Kontinuierliche Verteilungen

Da das Problem immer wieder auftaucht, geben wir ein explizites Beispiel für kontinuierliche Verteilungen. Peter Flom hatte eine gute Idee: Schauen Sie sich Mischungen von Normalen an. Eine Mischung aus zwei Normalen reicht nicht aus: Wenn ihre Schiefe verschwindet, ist sie symmetrisch. Der nächst einfachste Fall ist eine Mischung aus drei Normalen.

Gemische von drei Normalen hängen nach einer geeigneten Wahl von Ort und Maßstab von sechs realen Parametern ab und sollten daher mehr als ausreichend flexibel sein, um eine asymmetrische Lösung ohne Versatz zu erzeugen. Um einige zu finden, müssen wir wissen, wie man Schiefen von Normalenmischungen berechnet. Unter diesen werden wir nach unimodalen suchen (es ist möglich, dass es keine gibt).

Nun ist im Allgemeinen das (nicht-zentrale) Moment einer Standardnormalverteilung Null, wenn r ungerade ist und ansonsten gleich 2 r / 2 Γ ( 1 - r istrthr . Wenn wir diese Standardnormalverteilung neu skalieren, um eine Standardabweichung vonσ zu erhalten, wird dasr-teMoment mitσrmultipliziert. Wenn wir eine Verteilung umμ verschieben, kann das neuer-teMoment in Momenten bis einschließlichrausgedrückt werden. Der Moment einer Mischung von Verteilungen (dh ein gewichteter Durchschnitt von ihnen) ist der gleiche gewichtete Durchschnitt der einzelnen Momente. Schließlich ist die Schiefe genau dann Null, wenn das dritte zentrale Moment Null ist, und dies kann leicht anhand der ersten drei Momente berechnet werden.2r/2Γ(1r2)/πσrthσrμrthr

Dies gibt uns einen algebraischen Angriff auf das Problem. Eine Lösung , die ich gefunden ist eine gleiche Mischung von drei Normalen mit Parametern gleich zu ( 0 , 1 ) , ( 1 / 2 , 1 ) und ( 0 , (μ,σ)(0,1)(1/2,1). Seine mittlere equals(0+1/2+0)/3=1/6. Dieses Bild zeigt das PDF in blau und das PDF der Distributionumgedrehtin rot. Dass sie sich unterscheiden, zeigt, dass sie beide asymmetrisch sind. (Der Modus ist etwa0,0519216, ungleich dem Mittelwert von1/6.) Sie haben beide Null Schiefe durch Konstruktion.(0,127/18)(0,2.65623)(0+1/2+0)/3=1/60.05192161/6

Fortlaufende Beispiele

Die Darstellungen zeigen an, dass diese unimodal sind. (Mit Calculus können Sie lokale Maxima ermitteln.)

whuber
quelle
(+1) Sehr kluge Antwort. Funktioniert dies jedoch mit kontinuierlichen Distributionen? Würde die Verlagerung nicht möglicherweise winzige kleine Modi erzeugen? Ich kann nicht gerade denken ...
Makro
1
Du denkst ganz gut, Macro: Wir sollten alle so skeptisch sein. Der Trick ist, winzige Mengen über weite Bereiche zu verschieben. Ein Test der ersten Ableitung ermöglicht es Ihnen, nach möglichen Modi zu suchen, und liefert auch die Grundlage für den Beweis, dass ausreichend kleine Verschiebungen dieser Form keine neuen Modi hervorbringen.
whuber
Danke für die Antwort! Dies ähnelt dem, was ich intuitiv gedacht habe, obwohl ich es nicht gut in Worte fassen konnte - dass man die Masse auf jeder Seite der Distribution "ausgleichen" muss. Ich frage mich, ob es stereotype Wege gibt, wie man diesen Balanceakt durchführen kann.
Andy McKenzie
Eine Möglichkeit, Andy, besteht darin, mit einer diskreten Lösung zu beginnen und sie dann mit einer Normalverteilung zusammenzufassen. In diesem Fall erzwingt die Unimodalitätsanforderung, dass diese Normalverteilung eine große Standardabweichung aufweist. Auch wenn die Faltung die erforderlichen Eigenschaften (wie die Null-Schiefe) nicht nennenswert oder auf vorhersehbare Weise ändert, haben Sie ein mathematisches Problem im Griff. In gewisser Weise kann meine letzte Bearbeitung als ein solcher Angriff angesehen werden, obwohl es sich nicht ausschließlich um eine Faltung handelt (da die drei Normalen unterschiedliche Standardabweichungen haben).
Whuber
2
Ich habe es überprüft, Andy: Die Faltung der diskreten Lösung mit einer Normalverteilung ändert nichts an der Schiefe. Wenn Sie dieser Normalverteilung eine Standardabweichung um 0,57 oder mehr geben, ist das Ergebnis unimodal. Wie die zugrunde liegende diskrete Verteilung hat sie weiterhin einen Mittelwert von Null, eine Neigung von Null und ist asymmetrisch. Wenn Sie dies mit einer Standardnormalverteilung mischen, ergibt sich eine kontrollierte Massenbewegung zwischen der Standardnormalverteilung und der diskreten Verteilung: Dies könnte Ihren Wunsch nach einer "stereotypen" Methode erfüllen.
Whuber
23

Hier ist eine, die ich unter https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html# gefunden habe und die ich schön finde und in R wiedergebe: an inverse Burr oder Dagumverteilung mit Formparametern und c = 18,1484 :k=0.0629c=18.1484

g(x)=ckx(c+1)[1+xc](k+1)

Es hat einen Mittelwert von 0,5387, eine Standardabweichung von 0,2907, eine Schiefe von 0,0000 und eine Kurtosis von 2,0000. Die Quelle nennt es auch die "Elefanten-Distribution": Bildbeschreibung hier eingeben

Meine Reproduktion in R wurde mit erstellt

library(actuar)
library(knotR)

# a nonsymmetric distribution with zero skewness
# see https://www.qualitydigest.com/inside/quality-insider-article/problems-skewness-and-kurtosis-part-one.html#

c <- 18.1484
k <- 0.0629

x <- seq(0,1.5,by=.0001)

elephant.density <- dinvburr(x, k, c)
plot(x,elephant.density, type="l")
polygon(c(min(x),x),c(min(elephant.density),elephant.density), col="grey")
points(0.8,0.8, pch=19, cex=2)

# "ears" created via https://www.desmos.com/calculator/cahqdxeshd
ear.x <- c(0.686, 0.501, 0.42, 0.68)
ear.y <- c(0.698, 0.315, 1.095, 0.983)

myseg(bezier(cbind(ear.x, ear.y)), type="l")

EX <- gamma(k+1/c)*gamma(1-1/c)/gamma(k) # see p6 of https://wwz.unibas.ch/uploads/tx_x4epublication/23_07.pdf
EX2 <- gamma(k+2/c)*gamma(1-2/c)/gamma(k)
EX3 <- gamma(k+3/c)*gamma(1-3/c)/gamma(k)
(skewness <- (EX3 - 3*EX*(EX2-EX^2)-EX^3)/(EX2-EX^2)^(3/2)) # zero to three digits: 0.0003756196

Wie diese Ausgabe zeigt, ist die Schiefe für diese Parameterwerte nicht ganz null bis vierstellig. Hier ist ein kleiner Optimierer für und c :kc

   # optimize skewness a bit further
    skewval <- 1

while (skewval > 10^(-10)){
  optskew.k <- uniroot(skewness.fun, lower = k*.95, upper = k*1.1, tol=skewval^2, c=c)
  skewval <- optskew.k$f.root
  k <- optskew.k$root

  optskew.c <- uniroot(skewness.fun, lower = c*.95, upper = c*1.1, tol=skewval^2, k=k)
  skewval <- optskew.c$f.root
  c <- optskew.c$root
}

nachgebend

> print(c)
[1] 18.89306

> print(k)
[1] 0.05975542

> print(skewval)
[1] -1.131464e-15
Christoph Hanck
quelle
Vielen Dank für die Bearbeitung. Trotzdem konnte ich die Neigung von 0,0000 auf vier Stellen nicht reproduzieren und stattdessen 0,0001245138 erhalten (siehe nächste Änderung im R-Code).
Christoph Hanck
ck
Eigentlich 0,0003756196. 0,0001245138 wurde bereits nach anfänglicher Optimierung, hier aus Versehen angegeben. Ich werde nachsehen.
Christoph Hanck
@amoeba, ich habe versucht, ein bisschen zu optimieren, aber ich behaupte nicht, dass ich das auf clevere Weise getan habe, ich habe wenig Erfahrung mit der Optimierung.
Christoph Hanck
2
Eine Neigung von null bis drei Ziffern (fast vier) war für mich ausreichend. es ist nicht so, als würde ein genauerer Wert das Aussehen verändern. Wenn die Schiefe in dieser Umgebung Null überschreitet und klar ist, in welche Richtung die Werte geändert werden müssen, wenn mehr Genauigkeit erforderlich ist, ist dies meiner Meinung nach ausreichend. Aber ein großes Lob für den zusätzlichen Aufwand. (Es ist übrigens ein schönes Beispiel.)
Glen_b
9

Betrachten Sie eine Verteilung auf der positiven Hälfte der reellen Linie, die linear von 0 bis zum Modus ansteigt und dann rechts vom Modus exponentiell ist, im Modus jedoch stetig ist.

Dies könnte als Dreiecksexponentialverteilung bezeichnet werden (obwohl es oft ein bisschen wie eine Haifischflosse aussieht).

θλ

λθλθ6.15

Dreieck-Exponentiell mit Null-Schiefe

[1][2]

Der Thread Nicht-Normalverteilungen mit Null-Schräglage und Null-Überschuss-Kurtosis? hat einige asymmetrische Beispiele, einschließlich eines kleinen diskreten Beispiels und eines weiteren kontinuierlichen unimodalen:

Unimodale Gaußsche Mischung ohne Schräglage

Diskrete unimodale Verteilungen - oder äquivalente Proben - mit einer Neigung von Null sind recht einfach zu konstruieren, von großer oder kleiner Größe.

Hier ist ein Beispiel, das Sie als Stichprobe oder (durch Teilen der Rohfrequenzen durch 3000) als pmf behandeln können (die 'x'-Werte sind die genommenen Werte, die' n'-Werte sind die Häufigkeit, mit der der Wert in der Stichprobe auftritt ):

x:  -2   -1    0    1    2    3    4    5    6    7    8    9   10
n: 496  498  562 1434    2    1    1    1    1    1    1    1    1

Eine grafische Darstellung der Wahrscheinlichkeitsmassenfunktion, die aus den obigen Angaben konstruiert wurde

Dieses Beispiel setzt sich aus 3-Punkt-Verteilungen zusammen:

x:          -2              1                  c
n:   c(c-1)(c+1)/6     c(c-1)(c+1)/3 - c       1

über verschiedene Werte von c zwischen 3 und 10. Diese parametriert (von c) 3-Punkt "Atom" hat ichnichxich=0 und ichnichxich3=0, was wiederum bedeutet, dass Mischungen über verschiedene Auswahlmöglichkeiten von chaben null schiefe. (Sie können nichts kleiner machen als eine Verteilung über drei Punkte mit Asymmetrie und dem dritten zentralen Moment Null. Eine Sammlung einfacher Teile über nur wenige Punkte, wie diese, bilden ordentliche Bausteine, aus denen größere Strukturen hergestellt werden können.)

Es gibt alle Arten solcher "Atome", die man konstruieren kann, aber in diesem Beispiel wird nur diese eine Art verwendet. Zu einer solchen Kombination von Atomen werden einige symmetrisch angeordnete Werte hinzugefügt, um die verbleibenden Löcher auszufüllen und die Unimodalität zu gewährleisten, ohne die Struktur des mittleren und dritten Moments zu zerstören.

[1]Brizzi, M. (2006),
"A Skewed Modell Kombination Triangular und Exponential Eigenschaften: Die Two-faced Verteilung und seine statistischen Eigenschaften"
Austrian Journal of Statistics , 35 : 4, p455-462
http: //www.stat.tugraz. at / AJS / ausg064 /

[2]von Hippel, PT (2005),
"Mean, Median, and Skew: Korrektur einer Schulbuchregel"
Journal of Statistics Education, Band 13, Nummer 2,
http://ww2.amstat.org/publications/jse/v13n2/vonhippel.html

Glen_b - Setzen Sie Monica wieder ein
quelle
3
Könnte man es vielleicht die "Haifischflosse" nennen?
Glen_b -Reinstate Monica
@ Glen_b Totally Shark-fin in der Tat.
Alecos Papadopoulos
2

Sicher. Versuche dies:

skew= function (x, na.rm = FALSE) 
 {
    if (na.rm)    x <- x[!is.na(x)]             #remove missing values
    sum((x - mean(x))^3)/(length(x) * sd(x)^3)  #calculate skew   
 }

set.seed(12929883) 
x = c(rnorm(100, 1, .1), rnorm(100, 3.122, .1), rnorm(100,5, .1), rnorm(100, 4, .1), rnorm(100,1.1, .1))

 skew(x)
 plot(density(x))

(Du hast das harte Zeug schon gemacht!)

Peter Flom - Wiedereinsetzung von Monica
quelle
1
schön, ich mag es. +1
gung - Reinstate Monica
4
Es ist nicht bimodale ... es ist schrecklich Multi -modal. Versuchen Sie, die Dichte zu zeichnen. curve(0.2*(dnorm(x, 1, .1) + dnorm(x, 3.122, .1) + dnorm(x, 5, .1) + dnorm(x, 4, .1) + dnorm(x, 1.1, .1)), 0,10)
Gast
1
Auf diese Weise generierte Daten sind sicherlich nicht unimodal. Alles, was Sie tun müssen, um das zu sehen, ist Ihren Code wörtlich ausschneiden und einfügen. In der Tat wird eine Mischung normalverteilter Variablen niemals unimodal sein (es sei denn, eines der Mischungsverhältnisse ist natürlich 1).
Makro
8
@Macro, das stimmt nicht. Siehe zum Beispiel die Zusammenfassung von Roeder 1994 (JASA) für das bekannte Ergebnis, dass "die Dichte von zwei gemischten Normalen nicht bimodal ist, wenn die Mittelwerte nicht durch mindestens 2 Standardabweichungen getrennt sind". Wenn sie weniger voneinander entfernt sind, ist die Mischung unimodal.
Gast
1
Du hast recht @Gast. Ich hatte diese Möglichkeit vergessen, als ich meinen Beitrag schrieb
Makro
2

Für null Versatz brauchen wir

E[(X-μσ)3]=0
oder äquivalent,
E[(X-μσ)3|Xμ]+E[(X-μσ)3|X>μ]=0.

Wählen Sie nun für den gegebenen Mittelwert und die Varianz zwei beliebige Verteilungen aus Y. und Z mit Nullmasse auf der rechten Seite von μ und

E[(Y.-μσ)3]=E[(Z-μσ)3]
und definieren X passen Y. wenn links von μ und (μ-Z)Andernfalls. (Kennen Sie die genaue Notation dafür nicht?)

Die resultierende Verteilung ist unimodal, wenn die PDFs von Y. und Z nehmen links von zu μ (zusätzlich zur Null rechts von μ).

krlmlr
quelle
1
Wie stellen Sie sicher, dass die Distribution unimodal ist?
Dilip Sarwate
Vielen Dank für den Hinweis. Die PDFs vonY. und Z müssen streng erhöht werden, bis μund dann auf Null fallen.
krlmlr
Das ist die richtige Idee, aber es bedarf noch einiger Arbeit, weil σ kann sich beim Kombinieren ändern Y. und Z.
Whuber
@whuber: Verdammt. Ich wusste, dass es eine
Falle
2

Die folgende diskrete Verteilung ist asymmetrisch und weist eine Neigung von Null auf: Prob (-4) = 1/3, Prob (1) = 1/2, Prob (5) = 1/6. Ich fand es in der Veröffentlichung von Doric et al., Qual Quant (2009) 43: 481–493; DOI 10.1007 / s11135-007-9128-9

Petitjean
quelle
+1 Es checkt aus und es ist unimodal. Das ist das einfachste Beispiel.
whuber