Was ist der Unterschied zwischen Wahrscheinlichkeitsdiagrammen, PP-Diagrammen und QQ-Diagrammen, wenn versucht wird, eine angepasste Verteilung auf Daten zu analysieren?
39
Was ist der Unterschied zwischen Wahrscheinlichkeitsdiagrammen, PP-Diagrammen und QQ-Diagrammen, wenn versucht wird, eine angepasste Verteilung auf Daten zu analysieren?
Antworten:
Wie @ vector07 bemerkt , ist Wahrscheinlichkeitsdiagramm die abstraktere Kategorie, zu der pp-Diagramme und qq-Diagramme gehören. Daher werde ich die Unterscheidung zwischen den beiden letzteren erörtern. Der beste Weg, um die Unterschiede zu verstehen, besteht darin, darüber nachzudenken, wie sie aufgebaut sind, und zu verstehen, dass Sie den Unterschied zwischen den Quantilen einer Verteilung und dem Anteil der Verteilung erkennen müssen, den Sie durchlaufen haben, wenn Sie ein bestimmtes Quantil erreicht haben. Sie können die Beziehung zwischen diesen anzeigen, indem Sie die kumulative Verteilungsfunktion (CDF) einer Verteilung zeichnen. Betrachten Sie zum Beispiel die Standardnormalverteilung:
Wir sehen, dass ungefähr 68% der y-Achse (Bereich zwischen roten Linien) 1/3 der x-Achse (Bereich zwischen blauen Linien) entspricht. Das heißt, wenn wir den Anteil der Verteilung verwenden, den wir durchlaufen haben, um die Übereinstimmung zwischen zwei Verteilungen zu bewerten (dh wir verwenden einen pp-Plot), erhalten wir viel Auflösung in der Mitte der Verteilungen, aber weniger bei die Schwänze. Wenn wir andererseits die Quantile verwenden, um die Übereinstimmung zwischen zwei Verteilungen zu bewerten (dh wir verwenden einen qq-Plot), erhalten wir eine sehr gute Auflösung an den Schwänzen, jedoch weniger in der Mitte. (Da sich Datenanalysten in der Regel mehr Gedanken über die Schwänze einer Verteilung machen, die sich beispielsweise stärker auf die Inferenz auswirken, sind qq-Plots viel häufiger als pp-Plots.)
Um diese Fakten in Aktion zu sehen, gehe ich durch die Konstruktion eines PP-Plots und eines QQ-Plots. (Ich gehe hier auch verbal / langsamer durch die Konstruktion eines QQ-Plots : QQ-Plot stimmt nicht mit Histogramm überein .) Ich weiß nicht, ob Sie R verwenden, aber es wird hoffentlich selbsterklärend sein:
Leider sind diese Diagramme nicht sehr unterschiedlich, da es nur wenige Daten gibt und wir eine echte Normalverteilung mit der korrekten theoretischen Verteilung vergleichen, sodass weder in der Mitte noch in den Enden der Verteilung etwas Besonderes zu sehen ist. Um diese Unterschiede besser zu demonstrieren, zeichne ich eine (fettschwanzige) t-Verteilung mit 4 Freiheitsgraden und eine bimodale Verteilung unten. Die fetten Schwänze sind im qq-Plot viel ausgeprägter, während die Bimodalität im pp-Plot ausgeprägter ist.
quelle
Hier ist eine Definition von v8doc.sas.com :
Im Text erwähnen sie auch:
Referenz :
SAS Institute Inc., SAS OnlineDoc®, Version 8, Cary, NC: SAS Institute Inc., 1999
quelle