Nehmen wir zum Beispiel folgende Daten an:
8232302 684531 116857 89724 82267 75988 63871
23718 1696 436 439 248 235
Sie möchten einen einfachen Weg finden, um dieses (und mehrere andere Datasets) an eine Pareto-Distribution anzupassen. Idealerweise würde es die passenden theoretischen Werte ausgeben, weniger idealerweise die Parameter.
r
pareto-distribution
Felix
quelle
quelle
Antworten:
Nun, wenn Sie eine Stichprobe von aus einer Paretoverteilung mit den Parametern und (wobei die Untergrenze und der Formparameter ist), ist dies die logarithmische Wahrscheinlichkeit Probe ist: m > 0 α > 0 m αX1, . . . , Xn m > 0 α > 0 m α
Dies ist eine monotone Zunahme in , sodass der Maximierer der größte Wert ist, der mit den beobachteten Daten übereinstimmt. Da der Parameter die Untergrenze der Unterstützung für die Pareto-Verteilung definiert, ist das Optimummm m
was nicht von abhängt . Als nächstes muss das MLE für Verwendung gewöhnlicher Rechentricks erfüllenαα α
eine einfache Algebra sagt uns, dass die MLE von istα
In vielerlei Hinsicht (z. B. optimale asymptotische Effizienz durch Erreichen der Cramer-Rao-Untergrenze) ist dies der beste Weg, um Daten an eine Pareto-Verteilung anzupassen. Der folgende R-Code berechnet die MLE für einen bestimmten Datensatz
X
.Bearbeiten: Basierend auf den Kommentaren von @ cardinal und mir unten können wir auch feststellen, dass der Kehrwert des Stichprobenmittels der , die passieren haben eine exponentielle Verteilung. Wenn wir also Zugriff auf Software haben, die zu einer Exponentialverteilung passt (was wahrscheinlicher ist, da es bei vielen statistischen Problemen auftritt), kann eine Pareto-Verteilung angepasst werden, indem der Datensatz auf diese Weise transformiert und angepasst wird zu einer exponentiellen Verteilung auf der transformierten Skala. log(Xi/ m )α^ Log( Xich/ m^)
quelle
Sie können die
fitdist
imfitdistrplus
Paket enthaltene Funktion verwenden :quelle
library(fitdistrplus)
?library(actuar)
erforderlich ist, damit dies funktioniert.