Ich habe eine Probe, die ein Vektor mit 220 Zahlen ist. Hier ist ein Link zu einem Histogramm meiner Daten. . Und ich möchte überprüfen, ob meine Daten zu einer Pareto-Verteilung passen, aber ich möchte keine QQ-Diagramme mit dieser Verteilung sehen, aber ich brauche eine genaue Antwort mit p-Wert in R, wie zum Beispiel den Anderson-Darling-Test für Normalität ( ad.test
) . Wie könnte ich das machen? Bitte seien Sie so genau wie möglich.
r
distributions
pareto-distribution
stjudent
quelle
quelle
Antworten:
(PS) Zunächst denke ich, dass Glen_b in seinen obigen Kommentaren zur Nützlichkeit eines solchen Tests Recht hat: Reale Daten sind sicherlich nicht genau Pareto-verteilt, und für die meisten praktischen Anwendungen wäre die Frage: "Wie gut ist die Pareto-Näherung?" - und das QQ-Diagramm ist ein guter Weg, um die Qualität einer solchen Annäherung zu zeigen.
Wie auch immer, Sie können Ihren Test mit der Kolmogorov-Smirnov-Statistik durchführen, nachdem Sie die Parameter mit maximaler Wahrscheinlichkeit geschätzt haben. Diese Parameterschätzung verhindert, dass der Wert von verwendet wird , sodass Sie einen parametrischen Bootstrap durchführen können, um ihn zu schätzen. Wie Glen_b im Kommentar mitteilt, kann dies mit dem Lilliefors-Test verbunden werden .p
ks.test
Hier sind einige Zeilen R-Code.
Definieren Sie zunächst die Grundfunktionen für Pareto-Verteilungen.
Die folgende Funktion berechnet die MLE der Parameter (Begründungen in Wikipedia ).
Diese Funktionen berechnen die KS-Statistik und verwenden den parametrischen Bootstrap, um den Wert zu schätzen .p
Nun zum Beispiel eine Stichprobe aus einer Pareto-Distribution:
... und aus a :χ2( 2 )
Beachten Sie, dass ich nicht behaupte, dass dieser Test unvoreingenommen ist: Wenn die Stichprobe klein ist, kann eine gewisse Verzerrung bestehen. Der parametrische Bootstrap berücksichtigt die Unsicherheit bei der Parameterschätzung nicht gut (überlegen Sie, was passieren würde, wenn Sie mit dieser Strategie naiv testen, ob der Mittelwert einer normalen Variablen mit unbekannter Varianz Null ist).
PS Wikipedia sagt ein paar Worte dazu. Hier sind zwei weitere Fragen, für die eine ähnliche Strategie vorgeschlagen wurde: Anpassungstest für eine Mischung , Anpassungstest für eine Gammaverteilung .
quelle