Ich kenne keine multimodalen Distributionen.
Warum sind alle bekannten Distributionen unimodal? Gibt es eine "berühmte" Distribution, die mehr als einen Modus hat?
Natürlich sind Verteilungsmischungen oft multimodal, aber ich würde gerne wissen, ob es "Nicht-Mischungs" -Verteilungen gibt, die mehr als einen Modus haben.
distributions
mode
Miroslav Sabo
quelle
quelle
Antworten:
Der erste Teil der Frage wird in Kommentaren zur Frage beantwortet: Viele "Markennamen" -Distributionen sind multimodal, z. B. jede Beta -Distribution mit a < 1 und b < 1 . Kommen wir zum zweiten Teil der Frage.(a,b) a<1 b<1
Alle diskreten Verteilungen sind eindeutig Gemische (von Atomen, die unimodal sind).
Ich werde zeigen, dass die meisten stetigen Verteilungen auch Mischungen von unimodalen Verteilungen sind. Die Intuition dahinter ist einfach: Wir können Unebenheiten eines holprigen PDF-Diagramms nacheinander "abschleifen", bis das Diagramm horizontal ist. Die Unebenheiten werden zu den Mischungskomponenten, von denen jede offensichtlich unimodal ist.
Folglich lautet die Antwort auf die Frage , abgesehen von einigen ungewöhnlichen Verteilungen, deren PDFs höchst diskontinuierlich sind, "keine": Alle multimodalen Verteilungen, die absolut kontinuierlich, diskret oder eine Kombination dieser beiden sind, sind Mischungen von unimodalen Verteilungen.
Betrachten Sie kontinuierliche Verteilungen deren PDFs f kontinuierlich sind (dies sind die "absolut kontinuierlichen" Verteilungen). (Kontinuität ist keine große Einschränkung. Sie kann durch sorgfältige Analyse weiter gelockert werden, vorausgesetzt, die Diskontinuitätspunkte sind diskret.)F f
Um mit "Plateaus" von konstanten Werten fertig zu werden, die auftreten können, definieren Sie einen "Modus" als ein Intervall (das ein einzelner Punkt sein kann, bei dem x l = x u ), so dassm=[xl,xu] xl=xu
hat einen konstanten Wert für m , sagen wir y .f m, y
ist in keinem Intervall konstant, das ausschließlich m enthält.f m
Es gibt eine positive Zahl so dass der maximale Wert von f, der mit [ x l - ϵ , x u + ϵ ] erreicht wird, gleich y ist .ϵ f [xl−ϵ,xu+ϵ] y
Sei ein beliebiger Modus von f . Da f stetig ist, gibt es Intervalle die enthalten, für die in (das ist ein geeignetes Intervall, nicht nur ein Punkt) nicht abnimmt und in nicht zunimmt (das ist auch ein angemessenes Intervall). Sei das Infinimum all dieser Werte und das Supremum all dieser Werte.m=[xl,xu] f f m f [ x ' l , x' l ] [ x u , x ' u ] x ' l x ' u[x′l,x′u] m f [x′l,xl] [xu,x′u] x′l x′u
Diese Konstruktion hat einen "Buckel" in dem Graphen von sich von bis . Sei der größere von und . Durch Konstruktion wird die Menge der Punkte in , für die ist eine richtige Intervall streng enthaltend (weil sie entweder die gesamte enthält oder ).x ' l x ' u y f ( x ' l ) f ( x ' u ) x [ x ' l , x ' u ] f ( x ) ≥ y m ' m [ x 'f x′l x′u y f(x′l) f(x′u) x [x′l,x′u] f(x)≥y m′ m [xu,x ' u ][x′l,xl] [xu,x′u]
In dieser Abbildung eines multimodalen PDF ist ein Modus durch einen roten Punkt auf der horizontalen Achse gekennzeichnet. Die horizontale Ausdehnung des roten Teils der Füllung ist das Intervall : Es ist die Basis des Buckels, die durch die Mode . Die Basis dieses Buckels befindet sich auf der Höhe . Das Original-PDF ist die Summe aus roter und blauer Füllung. Beachten Sie, dass die blaue Füllung nur einen Modus in der Nähe von . Der ursprüngliche Modus bei wurde entfernt.m ' m y ≤ 0,16 2 [ 0 , 0 ]m=[0,0] m′ m y≈0.16 2 [0,0]
Schreiben vonDefinieren Sie für die Länge vonm '|m′| m′
und
wenn und sonst. (Dies macht im Übrigen zu einer stetigen Funktion.) Der Zähler ist der Betrag, um den über ansteigt, und der Nenner ist die Fläche zwischen dem Graphen von und . Somit ist nicht negativ und hat die Gesamtfläche : es ist das PDF einer Wahrscheinlichkeitsverteilung. Durch die Konstruktion hat es einen einzigartigen Modus .f m ( x ) = 0 f m f yx∈m′ fm(x)=0 fm f y f y f m 1 mpm f y fm 1 m
Auch vom Aufbau her die Funktion
ist ein PDF zur Verfügung gestellt . (Wenn ist, ist offensichtlich nichts mehr von übrig was unimodal gewesen sein muss.) Außerdem hat es keine Modi im Intervall (wo es konstant ist, weshalb die vorherige sorgfältige Definition von ein Modus als Intervall war notwendig). Außerdem,p m = 1 f , m 'pm<1 pm=1 f, m′
ist eine Mischung aus dem unimodalen PDF und dem PDF .f ' mfm f′m
Iterieren Sie diese Prozedur mit (die als lineare Kombination von stetigen Funktionen immer noch eine stetige Funktion ist und es uns ermöglicht, wie zuvor vorzugehen) und erzeugen Sie eine Folge von Modi ; entsprechende Folgen von Gewichten ; und PDFs Das einschränkende Ergebnis liegt vor, weil (a) das Intervall, in dem abgeflacht ist, ein geeignetes Intervall enthält, das in dem vorhergehenden nicht abgeflacht wurde m = m 1 , m 2 , ... p 1 = p m , p 2 = p m 2 , ... f 1 = f m , f 2 = f m 2 , ... . f i i - 1 ff′m m=m1,m2,… p1=pm,p2=pm2,… f1=fm,f2=fm2,…. fi i−1 Operationen und (b) die reellen Zahlen können nicht in mehr als eine abzählbare Anzahl solcher Intervalle zerlegt werden. Der Grenzwert kann keine Modi haben und ist daher konstant. Er muss Null sein (ansonsten würde sein Integral divergieren). Folglich wurde als Mischung ausgedrückt (möglicherweise nicht eindeutig, da die Reihenfolge, in der die Modi ausgewählt wurden, eine Rolle spielt)f
von unimodalen Verteilungen, QED.
quelle
Unimodal gesehen bedeutet das OP, dass es nur einen Innenmodus gibt (dh ohne Ecklösungen). Die Frage ist also wirklich ...
dh warum sehen die meisten Markennamen-Distributionen so aus:
... plus oder minus etwas Schräglauf oder einige Diskontinuitäten? Wenn die Frage so gestellt wird, wäre die Beta-Distribution kein gültiges Gegenbeispiel.
Es scheint, dass die Vermutung des OP eine gewisse Gültigkeit hat: Die meisten Markennamen-Distributionen erlauben nicht mehr als einen Innenmodus. Dafür kann es theoretische Gründe geben. Beispielsweise ist jede Verteilung, die Mitglied der Pearson-Familie ist (einschließlich der Beta), aufgrund der übergeordneten Differentialgleichung, die die gesamte Familie definiert, notwendigerweise (intern) unimodal. Und die Pearson-Familie nistet die meisten der bekanntesten Markennamen.
Trotzdem hier einige Markenzähler Beispiele ...
Gegenbeispiel
Ein Markengegenbeispiel ist die Distribution mit pdf:Sinc2
definiert auf der realen Linie. Hier ist ein Plot des pdf:Sinc2
Wir könnten vielleicht auch die Familie der Kardioden und Verteilungen hinzufügen, die mit dieser Klasse zusammenhängen ... mit PDF-Plots wie:
Die Familie der reflektierten Markennamen-Distributionen wäre möglicherweise auch ein möglicher Markennamen-Konkurrent (diese könnten jedoch als "Betrügerlösung" angesehen werden, aber sie sind immer noch Markennamen), wie der hier gezeigte Reflected Weibull:
quelle
Dass Sie vielleicht an keine denken, heißt nicht, dass es keine gibt.
Ich kann "bekannte" Distributionen nennen, die nicht unimodal sind.
Zum Beispiel eine Beta-Distribution mit und beide .α β <1
http://en.wikipedia.org/wiki/Beta_distribution
siehe auch
http://en.wikipedia.org/wiki/U-quadratic_distribution
(Dies ist kein Sonderfall der Betaverteilung, trotz des Kommentars, dass dies der Fall ist. Die beiden Familien haben jedoch einige Überschneidungen.)
Mischungsverteilungen sind sicherlich bekannt, und viele davon sind multimodal.
quelle
Alpha-Skew-Normalverteilung (Elal-Olivero 2010) hat ein PDF:
quelle