Warum sind alle bekannten Distributionen unimodal?

13

Ich kenne keine multimodalen Distributionen.

Warum sind alle bekannten Distributionen unimodal? Gibt es eine "berühmte" Distribution, die mehr als einen Modus hat?

Natürlich sind Verteilungsmischungen oft multimodal, aber ich würde gerne wissen, ob es "Nicht-Mischungs" -Verteilungen gibt, die mehr als einen Modus haben.

Miroslav Sabo
quelle
5
Sie sprechen eher von "Standard" -Distributionen als von "bekannten" Distributionen.
Stéphane Laurent
12
Wie wäre es mit Beta mit ? α=β=0.5
Amöbe sagt Reinstate Monica
1
Wenn Ihnen begrenzte bimodale Verteilungen nichts ausmachen , erwähnt Wikipedia auch die U- Quadrat- und die Arkussinusverteilung . Ich denke, dies sind nur Sonderfälle der Betaverteilung ... Wikipedia nennt auch einige Beispiele für natürliche Vorkommen multimodaler Verteilungen .
Nick Stauner
12
@ StéphaneLaurent: Ich mag "Markendistributionen" , weil die Übermittlung dieses Namens an sich keinen besonderen Status für eine Distribution impliziert. "Bekannte" Distributionen lassen es so klingen, als ob der Rest irgendwo da draußen sein könnte und nur darauf wartet, entdeckt zu werden, wie das Loch-Ness-Monster oder die Dunkle Materie.
Scortchi
5
Excellent @Scortchi, großartiger Wortschatz! Viele Nicht-Mathematiker, denen ich begegnet bin, haben den Eindruck, dass es keine Distribution ohne Namen gibt. Vielleicht steckt dahinter eine tiefere philosophische Tatsache, die Verwechslung eines Namens und des mit diesem Namen bezeichneten Dings (wie Russell sagte: "Das Wort" Hund "hat keine Ähnlichkeit mit einem Hund")
Stéphane Laurent

Antworten:

17

Der erste Teil der Frage wird in Kommentaren zur Frage beantwortet: Viele "Markennamen" -Distributionen sind multimodal, z. B. jede Beta -Distribution mit a < 1 und b < 1 . Kommen wir zum zweiten Teil der Frage.(a,b)a<1b<1

Alle diskreten Verteilungen sind eindeutig Gemische (von Atomen, die unimodal sind).

Ich werde zeigen, dass die meisten stetigen Verteilungen auch Mischungen von unimodalen Verteilungen sind. Die Intuition dahinter ist einfach: Wir können Unebenheiten eines holprigen PDF-Diagramms nacheinander "abschleifen", bis das Diagramm horizontal ist. Die Unebenheiten werden zu den Mischungskomponenten, von denen jede offensichtlich unimodal ist.

Folglich lautet die Antwort auf die Frage , abgesehen von einigen ungewöhnlichen Verteilungen, deren PDFs höchst diskontinuierlich sind, "keine": Alle multimodalen Verteilungen, die absolut kontinuierlich, diskret oder eine Kombination dieser beiden sind, sind Mischungen von unimodalen Verteilungen.


Betrachten Sie kontinuierliche Verteilungen deren PDFs f kontinuierlich sind (dies sind die "absolut kontinuierlichen" Verteilungen). (Kontinuität ist keine große Einschränkung. Sie kann durch sorgfältige Analyse weiter gelockert werden, vorausgesetzt, die Diskontinuitätspunkte sind diskret.) Ff

Um mit "Plateaus" von konstanten Werten fertig zu werden, die auftreten können, definieren Sie einen "Modus" als ein Intervall (das ein einzelner Punkt sein kann, bei dem x l = x u ), so dassm=[xl,xu]xl=xu

  1. hat einen konstanten Wert für m , sagen wir y .fm,y

  2. ist in keinem Intervall konstant, das ausschließlich m enthält.fm

  3. Es gibt eine positive Zahl so dass der maximale Wert von f, der mit [ x l - ϵ , x u + ϵ ] erreicht wird, gleich y ist .ϵf[xlϵ,xu+ϵ]y

Sei ein beliebiger Modus von f . Da f stetig ist, gibt es Intervalle die enthalten, für die in (das ist ein geeignetes Intervall, nicht nur ein Punkt) nicht abnimmt und in nicht zunimmt (das ist auch ein angemessenes Intervall). Sei das Infinimum all dieser Werte und das Supremum all dieser Werte.m=[xl,xu]ffm f [ x ' l , x' l ] [ x u , x ' u ] x ' l x ' u[xl,xu]mf[xl,xl][xu,xu]xlxu

Diese Konstruktion hat einen "Buckel" in dem Graphen von sich von bis . Sei der größere von und . Durch Konstruktion wird die Menge der Punkte in , für die ist eine richtige Intervall streng enthaltend (weil sie entweder die gesamte enthält oder ).x ' l x ' u y f ( x ' l ) f ( x ' u ) x [ x ' l , x ' u ] f ( x ) y m ' m [ x 'fxlxuyf(xl)f(xu)x[xl,xu]f(x)ymm[xu,x ' u ][xl,xl][xu,xu]

Zahl

In dieser Abbildung eines multimodalen PDF ist ein Modus durch einen roten Punkt auf der horizontalen Achse gekennzeichnet. Die horizontale Ausdehnung des roten Teils der Füllung ist das Intervall : Es ist die Basis des Buckels, die durch die Mode . Die Basis dieses Buckels befindet sich auf der Höhe . Das Original-PDF ist die Summe aus roter und blauer Füllung. Beachten Sie, dass die blaue Füllung nur einen Modus in der Nähe von . Der ursprüngliche Modus bei wurde entfernt.m ' m y 0,16 2 [ 0 , 0 ]m=[0,0]mmy0.162[0,0]

Schreiben vonDefinieren Sie für die Länge vonm '|m|m

pm=PrF(m)y|m|

und

fm(x)=f(x)ypm

wenn und sonst. (Dies macht im Übrigen zu einer stetigen Funktion.) Der Zähler ist der Betrag, um den über ansteigt, und der Nenner ist die Fläche zwischen dem Graphen von und . Somit ist nicht negativ und hat die Gesamtfläche : es ist das PDF einer Wahrscheinlichkeitsverteilung. Durch die Konstruktion hat es einen einzigartigen Modus .f m ( x ) = 0 f m f yxmfm(x)=0fmfy f y f m 1 mpmfyfm1m

Auch vom Aufbau her die Funktion

fm(x)=f(x)pmfm(x)1pm

ist ein PDF zur Verfügung gestellt . (Wenn ist, ist offensichtlich nichts mehr von übrig was unimodal gewesen sein muss.) Außerdem hat es keine Modi im Intervall (wo es konstant ist, weshalb die vorherige sorgfältige Definition von ein Modus als Intervall war notwendig). Außerdem,p m = 1 f , m 'pm<1pm=1f,m

f(x)=pmfm(x)+(1pm)fm(x)

ist eine Mischung aus dem unimodalen PDF und dem PDF .f ' mfmfm

Iterieren Sie diese Prozedur mit (die als lineare Kombination von stetigen Funktionen immer noch eine stetige Funktion ist und es uns ermöglicht, wie zuvor vorzugehen) und erzeugen Sie eine Folge von Modi ; entsprechende Folgen von Gewichten ; und PDFs Das einschränkende Ergebnis liegt vor, weil (a) das Intervall, in dem abgeflacht ist, ein geeignetes Intervall enthält, das in dem vorhergehenden nicht abgeflacht wurde m = m 1 , m 2 , ... p 1 = p m , p 2 = p m 2 , ... f 1 = f m , f 2 = f m 2 , ... . f i i - 1 ffmm=m1,m2,p1=pm,p2=pm2,f1=fm,f2=fm2,.fii1Operationen und (b) die reellen Zahlen können nicht in mehr als eine abzählbare Anzahl solcher Intervalle zerlegt werden. Der Grenzwert kann keine Modi haben und ist daher konstant. Er muss Null sein (ansonsten würde sein Integral divergieren). Folglich wurde als Mischung ausgedrückt (möglicherweise nicht eindeutig, da die Reihenfolge, in der die Modi ausgewählt wurden, eine Rolle spielt)f

f(x)=ipifi(x)

von unimodalen Verteilungen, QED.

whuber
quelle
7

Unimodal gesehen bedeutet das OP, dass es nur einen Innenmodus gibt (dh ohne Ecklösungen). Die Frage ist also wirklich ...

why is it that brand name distributions do NOT have more than one interior mode?

dh warum sehen die meisten Markennamen-Distributionen so aus:

Bildbeschreibung hier eingeben

... plus oder minus etwas Schräglauf oder einige Diskontinuitäten? Wenn die Frage so gestellt wird, wäre die Beta-Distribution kein gültiges Gegenbeispiel.

Es scheint, dass die Vermutung des OP eine gewisse Gültigkeit hat: Die meisten Markennamen-Distributionen erlauben nicht mehr als einen Innenmodus. Dafür kann es theoretische Gründe geben. Beispielsweise ist jede Verteilung, die Mitglied der Pearson-Familie ist (einschließlich der Beta), aufgrund der übergeordneten Differentialgleichung, die die gesamte Familie definiert, notwendigerweise (intern) unimodal. Und die Pearson-Familie nistet die meisten der bekanntesten Markennamen.

Trotzdem hier einige Markenzähler Beispiele ...

Gegenbeispiel

Ein Markengegenbeispiel ist die Distribution mit pdf:Sinc2

f(x)=sin2(x)πx2

definiert auf der realen Linie. Hier ist ein Plot des pdf:Sinc2

Bildbeschreibung hier eingeben

Wir könnten vielleicht auch die Familie der Kardioden und Verteilungen hinzufügen, die mit dieser Klasse zusammenhängen ... mit PDF-Plots wie:

Bildbeschreibung hier eingeben

Die Familie der reflektierten Markennamen-Distributionen wäre möglicherweise auch ein möglicher Markennamen-Konkurrent (diese könnten jedoch als "Betrügerlösung" angesehen werden, aber sie sind immer noch Markennamen), wie der hier gezeigte Reflected Weibull:

Bildbeschreibung hier eingeben

wolfies
quelle
1
Meine , dieser Plot von sieht sicher so aus, als hätte er einige negative Werte! (Könnte das ein Plot-Artefakt sein?) ... und die Nierenverteilungen sehen so aus, als hätten sie jeweils nur einen inneren Modus. Sinc2
whuber
1
Hi @whuber ... muss dem Plot-Artefakt zustimmen (ich werde das auf Mathematica SE aufgreifen !). Zur Familie der Herzkranken: Die Idee ist, dass man die Domäne solcher Familien beliebig erweitern kann, und wie eine Sinuswelle gibt es immer wieder :)
wolfies
1
(+1) Es ist ein seltsames Artefakt: Ihre letzte Handlung (der reflektierten Verteilungen) scheint es nicht zu zeigen. Sie können die Erzeugung der Diagrammpunkte im Diagramm verfolgen, um zu sehen, wo sie liegen. Ich vermute, dass die geringfügig negativen Werte ein Überschießen eines Splines einer kleinen Anzahl von Punkten sein könnten. Sinc2
Whuber
Ich denke, es liegt nur daran, dass die geplottete Linie dicker ist als die Achsenlinie, so dass es so aussieht, als würde sie die Achse überschießen, wenn sie nahe bei Null liegt. Wenn die Linie dünner gezeichnet wird, verschwindet das Artefakt.
Wolfies
In Ihrer unteren Figur gibt es jedoch kein solches Artefakt, das auch Linien aufweist, die dicker als die Achse sind.
Whuber
3

Dass Sie vielleicht an keine denken, heißt nicht, dass es keine gibt.

Ich kann "bekannte" Distributionen nennen, die nicht unimodal sind.

Zum Beispiel eine Beta-Distribution mit und beide .αβ<1

http://en.wikipedia.org/wiki/Beta_distribution

siehe auch

http://en.wikipedia.org/wiki/U-quadratic_distribution

(Dies ist kein Sonderfall der Betaverteilung, trotz des Kommentars, dass dies der Fall ist. Die beiden Familien haben jedoch einige Überschneidungen.)

Mischungsverteilungen sind sicherlich bekannt, und viele davon sind multimodal.

Glen_b - Setzen Sie Monica wieder ein
quelle
Das U-Quadrat ist eine abgeschnittene Beta-Verteilung.
Becko
1

Alpha-Skew-Normalverteilung (Elal-Olivero 2010) hat ein PDF:

(1αxμσ)2+12+α2φ(xμσ),

φ

|α|>1.34μ=1,σ=0.5,a=2

Bildbeschreibung hier eingeben

corey979
quelle