Das ist für mich ziemlich schwer zu beschreiben, aber ich werde versuchen, mein Problem verständlich zu machen. Zuerst muss man wissen, dass ich bisher eine sehr einfache lineare Regression durchgeführt habe. Bevor ich den Koeffizienten schätzte, beobachtete ich die Verteilung meines . Es ist schwer links schief. Nachdem ich das Modell geschätzt hatte, war ich mir ziemlich sicher, dass ich auch einen linksgerichteten Rest in einem QQ-Plot beobachten konnte, aber ich tat es absolut nicht. Was könnte der Grund für diese Lösung sein? Wo ist der Fehler? Oder hat die Verteilung nichts mit der Verteilung der Fehlerterm zu tun?
regression
residuals
skewness
MarkDollar
quelle
quelle
Antworten:
Um Ihre Frage zu beantworten, nehmen wir ein sehr einfaches Beispiel. Das einfache Regressionsmodell ist gegeben durch , wobei . Nehmen wir nun an, dass dichotom ist. Wenn nicht gleich Null ist, ist die Verteilung von nicht normal, sondern eine Mischung aus zwei Normalverteilungen, eine mit dem Mittelwert und eine mit dem Mittelwert .yich= β0+ β1xich+ ϵich ϵich∼ N.( 0 , σ2) xich β1 yich β0 β0+ β1
Wenn groß genug und klein genug ist, sieht ein Histogramm von bimodal aus. Man kann jedoch auch ein Histogramm von , das wie eine "einzelne" verzerrte Verteilung aussieht. Hier ist ein Beispiel (mit R):β1 σ2 yich yich
Es kommt nicht auf die Verteilung von , sondern auf die Verteilung der Fehlerterme.yich
Und das sieht ganz normal aus - nicht nur im übertragenen Sinne =)
quelle
In Bezug auf die hervorragende Antwort von @Wolfgang sind hier die Diagramme aus seinem R-Code:
quelle