Ich bin auf der Suche nach einer Verteilung, bei der die Wahrscheinlichkeitsdichte nach einem Punkt, der vom Mittelwert abweicht, schnell abnimmt, oder nach meinen eigenen Worten nach einer "plateauförmigen Verteilung".
Etwas zwischen der Gaußschen und der Uniform.
Antworten:
Möglicherweise suchen Sie nach Verteilungen, die unter den Bezeichnungen generalisierte Normalverteilung (Version 1) , Subbotinverteilung oder Exponentialverteilung bekannt sind. Es wird durch Position , Skalierung und Form mit PDF parametrisiertσ βμ σ β
Wie Sie sehen können, ähnelt es bei der Laplace-Verteilung und konvergiert mit ihr, bei konvergiert es zur Normalverteilung und bei zur Gleichverteilung.β = 2 β = ∞β= 1 β= 2 β= ∞
Wenn Sie nach Software suchen, für die diese implementiert ist, können Sie dieLp
normalp
Bibliothek auf R prüfen (Mineo und Ruggieri, 2005). Das Schöne an diesem Paket ist, dass es unter anderem eine Regression mit generalisierten normalverteilten Fehlern implementiert, dh die Norm minimiert .Mineo, AM & Ruggieri, M. (2005). Ein Software-Tool für die exponentielle Energieverteilung: Das Paket normalp. Journal of Statistical Software, 12 (4), 1-24.
quelle
@ StrongBads Kommentar ist ein wirklich guter Vorschlag. Die Summe aus einem einheitlichen RV und einem Gaußschen RV kann genau das liefern, wonach Sie suchen, wenn Sie die richtigen Parameter auswählen. Und es hat tatsächlich eine einigermaßen schöne geschlossene Formlösung.
Das pdf dieser Variablen ergibt sich aus dem Ausdruck:
σein ist der "Radius" der mittleren Null-Gleichförmigkeit RV.
ist die Standardabweichung des mittleren Null-Gauß-RV.σ
quelle
Es gibt unendlich viele "plateauförmige" Verteilungen.
Warst du nach etwas Spezifischerem als "Zwischen Gauß und Uniform"? Das ist etwas vage.
Hier ist eine einfache: Sie könnten immer eine Halbnormale an jedes Ende einer Uniform kleben:
Sie können die "Breite" der Uniform in Bezug auf die Normalskala so steuern, dass Sie breitere oder schmalere Plateaus haben, was eine ganze Klasse von Verteilungen ergibt, einschließlich der Gaußschen und der Uniform als Grenzfälle.
Die Dichte beträgt:
Wobeih = 11 + w / ( 2 π√σ)
Als für festes nähern wir uns der Uniform an und als für festes nähern wir uns .σ→ 0 w ( μ - w / 2 , μ + w / 2 ) w → 0 σ N( μ , σ2)
Hier einige Beispiele (jeweils mit ):μ = 0
Wir könnten diese Dichte vielleicht als "Uniform mit Gaußschwanz" bezeichnen.
quelle
Siehe meine "Devil's Tower" -Verteilung hier [1]:
Noch interessanter ist die Verteilung "Slip-Dress".
Es ist einfach, Verteilungen mit jeder gewünschten Form zu konstruieren.
[1]: Westfall, PH (2014)
"Kurtosis as Peakedness, 1905 - 2014. RIP"
Am. Stat. 68 (3): 191–195. doi: 10.1080 / 00031305.2014.917055
public access pdf: http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4321753/pdf/nihms-599845.pdf
quelle
Viele nette Antworten. Die hier angebotene Lösung weist zwei Merkmale auf: (i) dass sie eine besonders einfache funktionale Form aufweist und (ii) dass die resultierende Verteilung notwendigerweise ein plateau-förmiges PDF erzeugt (nicht nur als Sonderfall). Ich bin mir nicht sicher, ob dies bereits einen Namen in der Literatur hat, aber ohne denselben, nennen wir es eine Plateau-Distribution mit pdf :f(x)
woher:
Hier ist eine grafische Darstellung des PDF-Dokuments für verschiedene Werte von Parameter :a
.
Wenn der Parameter groß wird, tendiert die Dichte zu einer gleichmäßigen (-1,1) Verteilung. Das folgende Diagramm ist auch mit einem Standard-Normal (grau gestrichelt) vergleichbar:a
quelle
Ein anderes ( EDIT : Ich habe es jetzt vereinfacht. EDIT2 : Ich habe es noch weiter vereinfacht, obwohl das Bild jetzt nicht wirklich diese exakte Gleichung widerspiegelt):
Klobig, ich weiß, aber hier habe ich die Tatsache ausgenutzt, dass sich einer Linie nähert, wenn zunimmt.xlog(cosh(x)) x
Grundsätzlich haben Sie die Kontrolle darüber, wie glatt der Übergang ist ( ). Wenn und garantiere ich, dass es eine gültige Wahrscheinlichkeitsdichte ist (summiert sich zu 1). Wenn Sie andere Werte wählen, müssen Sie diese neu normieren.a = 2 b = 1alpha a=2 b=1
Hier ist ein Beispielcode in R:
f
ist unsere Distribution. Zeichnen wir es für eine Sequenz vonx
Konsolenausgabe:
Und Handlung:
Sie könnten ändern
a
undb
ungefähr den Anfang bzw. das Ende der Steigung, aber dann wäre eine weitere Normalisierung erforderlich, und ich habe es nicht berechnet (aus diesem Grund verwende icha = 2
undb = 1
im Plot).quelle
Wenn Sie etwas sehr Einfaches suchen, mit einem zentralen Plateau und den Seiten einer Dreiecksverteilung, können Sie beispielsweise N Dreiecksverteilungen kombinieren, wobei N vom gewünschten Verhältnis zwischen Plateau und Abstieg abhängt. Warum Dreiecke, weil ihre Abtastfunktionen in den meisten Sprachen bereits existieren. Sie sortieren nach dem Zufallsprinzip aus einem von ihnen.
In R würde das ergeben:
quelle
Hier ist eine schöne: das Produkt von zwei logistischen Funktionen.
Dies hat den Vorteil, nicht stückweise zu sein.
B stellt die Breite und A die Steilheit des Abfalls ein. Dargestellt sind B = 1: 6 mit A = 2. Hinweis: Ich habe mir nicht die Zeit genommen, um herauszufinden, wie ich das richtig normalisieren kann.
quelle