Wenn ich mich nicht irre, wird in einem linearen Modell angenommen, dass die Verteilung der Antwort eine systematische und eine zufällige Komponente aufweist. Der Fehlerbegriff erfasst die zufällige Komponente. Wenn wir also davon ausgehen, dass der Fehlerterm normalverteilt ist, bedeutet das dann nicht, dass die Antwort auch normalverteilt ist? Ich denke schon, aber dann scheinen Aussagen wie die folgende ziemlich verwirrend:
Und Sie können deutlich sehen, dass die einzige Annahme von "Normalität" in diesem Modell darin besteht, dass die Residuen (oder "Fehler" ) normal verteilt sein sollten. Es gibt keine Annahme über die Verteilung des Prädiktors x i oder der Antwortvariablen y i .
Quelle: Prädiktoren, Antworten und Residuen: Was muss eigentlich normal verteilt werden?
quelle
Antworten:
Das Standard-OLS-Modell ist mit ε ∼ N ( → 0 , σ 2 I n ) für ein festes X ∈ R n × p .Y=Xβ+ε ε ∼ N( 0⃗ , σ2ichn) X∈ Rn × p
Dies bedeutet in der Tat, dass , obwohl dies eine Konsequenz unserer Annahme über die Verteilung von ε ist , anstatt tatsächlich die Annahme zu sein. Denkenauch darandass ich über die bedingte Verteilung von rede Y , nicht die Randverteilung von Y . Ich konzentriere mich auf die bedingte Verteilung, weil ich denke, dass Sie genau danach fragen.Y.| {X, β, σ2} ∼ N( Xβ, σ2ichn) ε Y. Y.
Ich denke, der verwirrende Teil ist, dass dies nicht bedeutet, dass ein Histogramm von normal aussehen wird. Wir sagen, dass der gesamte Vektor Y ein einziger Zug aus einer multivariaten Normalverteilung ist, wobei jedes Element einen potentiell unterschiedlichen Mittelwert E ( Y i | X i ) = X T i β hat . Dies ist nicht dasselbe wie eine normale Stichprobe. Die Fehler & egr ; sind tatsächlich eine iid-Stichprobe, so dass ein Histogramm von ihnen normal aussehen würde (und deshalb machen wir eine QQ-Darstellung der Residuen, nicht der Antwort).Y. Y. E( Yich| Xich) = XTichβ ε
Hier ist ein Beispiel: Angenommen, wir messen die Höhe für eine Stichprobe von 6. und 12. Schülern. Unser Modell ist H i = β 0 + β 1 I ( 12. Klasse ) + ε i mit ε i ∼ iid N ( 0 , σ 2 ) . Wenn wir uns ein Histogramm des H i ansehen, werden wir wahrscheinlich eine bimodale Verteilung mit einem Peak für Schüler der 6. Klasse und einem Peak für Schüler der 12. Klasse sehen, aber das stellt keinen Verstoß gegen unsere Annahmen dar.H Hich= β0+ β1ich( 12. Klasse ) + εich εich∼ iid N ( 0 , σ2) Hich
quelle
Nicht einmal aus der Ferne. Ich erinnere mich daran, dass die Residuen unter normalen Bedingungen vom deterministischen Teil des Modells abhängen . Hier ist eine Demonstration, wie das in der Praxis aussieht.
Ich beginne damit, zufällig Daten zu generieren. Dann definiere ich ein Ergebnis, das eine lineare Funktion der Prädiktoren ist, und schätze ein Modell.
Schauen wir uns an, wie diese Residuen aussehen. Ich vermute, dass sie normal verteilt sein sollten, da dem Ergebnis
y
normales Rauschen hinzugefügt wurde. Und in der Tat ist das der Fall.Wenn wir jedoch die Verteilung von y überprüfen, können wir feststellen, dass dies definitiv nicht normal ist! Ich habe die Dichtefunktion mit dem gleichen Mittelwert und der gleichen Varianz überlagert wie
y
, aber es ist offensichtlich eine schreckliche Anpassung!Der Grund, warum dies in diesem Fall passiert ist, ist, dass die Eingabedaten nicht einmal aus der Ferne normal sind. Nichts an diesem Regressionsmodell erfordert Normalität, außer in den Residuen - nicht in der unabhängigen Variablen und nicht in der abhängigen Variablen.
quelle
Nein, das tut es nicht. Nehmen wir zum Beispiel an, wir haben ein Modell, das das Gewicht der olympischen Athleten vorhersagt. Während das Gewicht normalerweise auf die Athleten in jeder Sportart verteilt sein könnte, ist es nicht unter allen Athleten - es ist möglicherweise nicht einmal unimodal.
quelle