Das qq-Diagramm kann verwendet werden, um zu visualisieren, wie ähnlich zwei Verteilungen sind (z. B. um die Ähnlichkeit einer Verteilung mit einer Normalverteilung zu visualisieren, aber auch um zwei Artibrary-Datenverteilungen zu vergleichen). Gibt es Statistiken, die ein objektiveres numerisches Maß erzeugen, das ihre Ähnlichkeit darstellt (vorzugsweise in normalisierter Form (0 <= x <= 1))? Der Gini-Koeffizient wird beispielsweise in der Wirtschaft verwendet, wenn mit Lorenz-Kurven gearbeitet wird. Gibt es etwas für QQ-Plots?
quelle
Ich habe kürzlich die Korrelation zwischen der empirischen CDF und der angepassten CDF verwendet, um die Anpassungsgüte zu quantifizieren, und ich frage mich, ob dieser Ansatz auch im aktuellen Fall nützlich sein könnte, der meines Wissens den Vergleich zweier empirischer Datensätze beinhaltet. Eine Interpolation kann erforderlich sein, wenn zwischen den Sätzen eine unterschiedliche Anzahl von Beobachtungen besteht.
quelle
Ich würde sagen, dass der mehr oder weniger kanonische Weg, zwei Verteilungen zu vergleichen, ein Chi-Quadrat-Test wäre. Die Statistik ist jedoch nicht normalisiert und hängt davon ab, wie Sie die Fächer auswählen. Der letzte Punkt kann natürlich als Merkmal und nicht als Fehler angesehen werden: Wenn Sie die Behälter entsprechend auswählen, können Sie die Ähnlichkeit in den Schwänzen genauer untersuchen als beispielsweise in der Mitte der Verteilungen.
quelle
Ein ziemlich direktes Maß für die "Nähe" zur Linearität in einem QQ-Diagramm wäre eine Shapiro-Francia-Teststatistik (die eng mit der bekannteren Shapiro-Wilk verwandt ist und als einfache Annäherung daran angesehen werden kann).
Die Shapiro-Francia-Statistik ist die quadratische Korrelation zwischen den geordneten Datenwerten und der erwarteten Statistik normaler Ordnung (manchmal als "theoretische Quantile" bezeichnet) - das heißt, es sollte das Quadrat der Korrelation sein, das Sie in der Darstellung sehen, ziemlich direkt zusammenfassende Maßnahme.
(Der Shapiro-Wilk ist ähnlich, berücksichtigt jedoch Korrelationen zwischen den Auftragsstatistiken. Er hat eine ähnliche Interpretation wie der Shapiro-Francia und ist genauso nützlich wie eine Zusammenfassung des QQ-Diagramms.)
In beiden Fällen könnte für eine Zusammenfassung einer einzelnen Zahl dessen, was das QQ-Diagramm zeigt, eine davon eine geeignete Möglichkeit sein, das Diagramm zusammenzufassen.
quelle