Wenn mein qqplot linear ist, der Gradient jedoch nicht mit der 45-Grad-Linie übereinstimmt, was deutet dies darauf hin?
Ich versuche, die Anpassung der Laplace-Verteilung an meine Probendaten zu untersuchen. Daher habe ich zufällig Laplace-verteilte Beobachtungen (mit aus meiner Stichprobe geschätzten Parametern) generiert und diese gegen meine Stichprobe aufgetragen:
qqplot(rand, sample)
abline(0, 1, col = 'red')
code
haben Sie verwendet? Was ist das Ziel? Eine bestimmte Verteilung ablehnen? Überprüfen Sie auch Dichtediagramme und Histogramme.Antworten:
Aufgrund des Mangels an Daten in Ihrer Frage verwende ich in meiner Antwort unten die Gaußsche Verteilung im Vergleich zu einer Stichprobe (anstelle der Laplace-Verteilung im Vergleich zu Ihren Beispieldaten).
In Bezug auf die beiden ersten Momente ist die Interpretation dessen, was Sie im qq-Plot sehen, wie folgt:
Wenn die Verteilungen identisch sind, erwarten Sie eine Linie :x = y
Wenn die Mittelwerte unterschiedlich sind, erwarten Sie einen Achsenabschnitt , was bedeutet, dass er über oder unter der Linie liegt:a ≠ 0 x = y
Wenn die Standardabweichungen unterschiedlich sind, erwarten Sie eine Steigung :b ≠ 1
Um sich ein Bild davon zu machen, können Sie die CDFs einfach im selben Diagramm zeichnen. Nehmen Sie zum Beispiel den letzten:
Nehmen wir zum Beispiel 3 Punkte auf der y-Achse:C.D F.( q) = 0,2 , 0,5 , 0,8 und sehen, welchen Wert von q (Quantil) gibt uns jeden CDF-Wert.
Sie können sehen, dass:
Welches ist, was durch das qq-Diagramm gezeigt wird.
quelle
Die Linearität des QQ-Diagramms legt nur nahe, dass Ihre Stichprobe einer Normalverteilung folgt (oder genauer gesagt, ihre Quantilfunktion ist die Probit-Funktion). Die Steigung wird durch die Standardabweichung bestimmt (für sd = 1 erhalten wir die populärex = y Linie).
Ein S-förmiges Diagramm, das über eine 180-Grad-Drehung symmetrisch erscheint, weist auf eine symmetrische Verteilung hin.
Eine intuitive Begründung für die Form ist also; Um eine gerade Linie zu erhalten, benötigen Sie eine ähnliche Skalierung des Abstands der Quantile um den Mittelwert. Das heißt, wenn sagenxt h Quantil ist ein gewisser Anteil der Entfernung vom Mittelwert im Vergleich zu yt h Quantil bleibt der Anteil erhalten, der nur bei Normalverteilung erhalten bleibt. Die Steigung zeigt eher die absolute Größe dieses Anteils an und hängt daher von der SD ab. Verschiedene Formen können auf ähnliche Weise begründet werden, indem dieses Verhältnis an verschiedenen Stellen entlang der Verteilung betrachtet wird.
Hier sind einige Visualisierungen.
Hinweis: Ich zeichne die Probe wie üblich auf der Y-Achse und gehe davon aus, dass die Art und Weise, wie Sie sie gezeichnet haben, die Probe auf der x-Achse platziert.
R-Code:
quelle