Als Annahme einer linearen Regression wird die Normalität der Fehlerverteilung manchmal fälschlicherweise "erweitert" oder als Notwendigkeit der Normalität von y oder x interpretiert.
Ist es möglich, ein Szenario / einen Datensatz zu erstellen, bei dem X und Y nicht normal sind, der Fehlerterm jedoch lautet und daher die erhaltenen linearen Regressionsschätzungen gültig sind?
Antworten:
Erweiterung des Kommentars von Hong Oois mit einem Bild. Hier ist ein Bild eines Datensatzes, in dem keiner der Ränder normal verteilt ist, die Residuen jedoch noch vorhanden sind. Daher gelten die Annahmen der linearen Regression weiterhin:
Das Bild wurde mit dem folgenden R-Code erzeugt:
quelle