Ich habe eine Stichprobe von Daten, die aus einer kontinuierlichen Zufallsvariablen X generiert wurden. Und aus dem Histogramm, das ich mit R zeichne, schätze ich, dass die Verteilung von X möglicherweise einer bestimmten Gamma-Verteilung folgt. Aber ich kenne die genauen Parameter dieser Gamma-Verteilung nicht.
Meine Frage ist, wie man prüft, ob die Verteilung von X zu einer Familie der Gamma-Verteilung gehört? Es gibt einige gute Anpassungstests wie Kolmogorov-Smirnov-Test, Anderson-Darling-Test usw., aber eine der Einschränkungen bei der Verwendung dieser Tests besteht darin, dass die Parameter der theoretischen Verteilung im Voraus bekannt sein sollten. Kann mir jemand sagen, wie ich dieses Problem lösen kann?
Antworten:
Ich denke, die Frage verlangt nach einem präzisen statistischen Test, nicht nach einem Histogrammvergleich. Bei Verwendung des Kolmogorov-Smirnov-Tests mit geschätzten Parametern hängt die Verteilung der Teststatistik unter der Null von der getesteten Verteilung ab, im Gegensatz zum Fall ohne geschätzten Parameter. Zum Beispiel mit (in R)
führt zu
während wir bekommen
für die gleiche Probe x. Das Signifikanzniveau oder der p-Wert muss daher durch Monte-Carlo-Simulation unter der Null bestimmt werden, wobei die Verteilung der Kolmogorov-Smirnov-Statistik aus Proben erstellt wird, die unter der geschätzten Verteilung simuliert wurden (mit einer geringfügigen Annäherung des Ergebnisses an die beobachtete Probe) kommt aus einer anderen Distribution, auch unter der Null).
quelle
Berechnen Sie MLEs der Parameter unter der Annahme einer Gammaverteilung für Ihre Daten und vergleichen Sie die theoretische Dichte mit dem Histogramm Ihrer Daten. Wenn die beiden sehr unterschiedlich sind, ist die Gammaverteilung eine schlechte Annäherung an Ihre Daten. Für einen formalen Test könnten Sie beispielsweise die Kolmogorov-Smirnoff-Teststatistik berechnen, die die am besten passende Gammaverteilung mit der empirischen Verteilung und dem Signifikanztest vergleicht.
quelle