QQ-Plot-Referenzlinie nicht 45 °

10

Ich habe (standardisierte) Rückgabedaten mit qqplot()in MATLAB gegen die theoretischen Quantile einer Normalverteilung aufgetragen. Die Linie im QQ-Plot hat jedoch keinen Winkel von 45 °, sondern ist ein wenig gedreht.

Vielleicht verstehe ich das Konzept eines QQ-Diagramms falsch, aber soll es nicht genau eine 45 ° -Linie sein?

Ich habe die Handlung eingefügt, um das Problem zu veranschaulichen.

QQ Plot standardisierter Rückgabedaten

mscnvrsy
quelle
Standardisierte Rückgabedaten sind bekanntermaßen nicht normal. Warum sollten sie also auf einer 45-Grad-Linie liegen? Die Renditen sind schwerer als normal, und das zeigen auch Ihre Daten.
Glen_b -State Monica
Ich bin mir der Nicht-Normalität bewusst und dass die Punkte nicht auf der Linie selbst liegen sollten. Ich habe mich eher gefragt, warum die Linie nicht 45 ° ist.
mscnvrsy
Oh sorry, das war nicht klar. Ich habe eine Antwort gepostet.
Glen_b -State Monica

Antworten:

18

Sollte es eine 45-Grad-Linie sein? Es hängt davon ab, ob!

Ein QQ-Diagramm ist die Parameterkurve, die definiert ist durch:

x=F1(p)y=G1(p)

p[0,1]F1G1

Wenn dann ist und es wäre auf einer 45-Grad-Linie.F=Gx(p)=y(p)

Ein anderer Fall...

  • Sei die normale inverse Standard-CDF.Φ1(p)
  • SeiF1(p)=Φ1(p)
  • SeiG1(p)=σΦ1(p)+μ

Das heißt, ist die inverse CDF für eine normalverteilte Zufallsvariable mit Mittelwert und Standardabweichung während die inverse CDF für eine Standardnormalvariable ist (dh Mittelwert 0, Standardabweichung 1). Dann sehen wir:GμσF

y(p)=σΦ1(p)+μ=σx(p)+μ

Das heißt, die Darstellung ist eine Liniey=σx+μ

Was ist in deinem Fall los?

Aus der Matlab-Dokumentation fürqqplot

Dem Diagramm ist eine Linie überlagert, die das erste und dritte Quartil jeder Verteilung verbindet (dies ist eine robuste lineare Anpassung der Ordnungsstatistik der beiden Stichproben). Diese Linie wird bis zu den Enden der Stichprobe extrapoliert, um die Linearität der Daten zu bewerten.

Selbst wenn Sie Ihre Daten standardisieren würden, wären die MATLAB-Diagramme mit der roten Linie keine 45-Grad-Linie, wenn das 1. und 3. Quartil nicht mit der Normalverteilung übereinstimmen würden.

Matthew Gunn
quelle
Vielen Dank! Ich dachte, die rote Linie ist so konstruiert, dass Sie die Abweichungen von den normalen Standardquantilen sehen können. Wenn ich standardisierte Daten verwende, sollte die Zeile dann y = x sein, nicht wahr?
mscnvrsy
@mscnvrsy Die rote Linie, die ich in MATLAB denke, soll zeigen, was es sein sollte, wenn Ihre Daten der Normalverteilung folgen.
Matthew Gunn
Gibt es eine Möglichkeit, eine 45 ° -Linie als Referenzlinie zu erhalten? Ich dachte, dies könnte durch Standardisierung erreicht werden.
mscnvrsy
@mscnvrsy hmmm .... Ich bin jetzt verwirrt, woher MATLABs rote Linie im QQPlot kommt: P Gib mir eine Sekunde ... Ich überprüfe den Quellcode ...
Matthew Gunn
Für mich sieht es eher nach einer OLS-Passform aus. Leider kann man in der keine relevanten Parameter einstellen qqplot().
mscnvrsy
2

(x,y)=(0.6745,Q1)(0.6745,Q3)

Wenn Sie sich die Matlab-Hilfe für qqplot ansehen, heißt es tatsächlich, dass Matlab dies tut.

Die Stichprobenverteilung ist so spitz und schwanzförmig, dass die Quartile näher beieinander liegen als bei einer Normalverteilung mit derselben Standardabweichung, wodurch die Steigung näher an 0,7 als an 1 liegt.

Glen_b -Reinstate Monica
quelle