Wie wirkt sich die Verteilung des Fehlerausdrucks auf die Verteilung der Antwort aus?

14

Wenn ich also annehme, dass die Fehlerterme normalerweise in einer linearen Regression verteilt sind, was bedeutet das für die Antwortvariable ?y

MarkDollar
quelle

Antworten:

7

Vielleicht bin ich weg, aber ich denke, wir sollten uns über wundern , so lese ich das OP. Im einfachsten Fall der linearen Regression ist, wenn Ihr Modell ist, die einzige stochastische Komponente in Ihrem Modell der Fehlerterm. Als solches bestimmt es die Stichprobenverteilung von . Wenn ϵ N ( 0 , σ 2 I ) ist, dann ist y | X , β N ( X β , σ 2 I ) . Was @Aniko sagt, gilt mit Sicherheit für f (y = X β + ϵ yf(y|β,X)y=Xβ+ϵyϵN(0,σ2I)y|X,βN(Xβ,σ2I)f(y) (geringfügig überX,β ). Aus heutiger Sicht ist die Frage etwas vage.

JMS
quelle
Ich mag alle Kommentare! Und sie scheinen alle recht zu haben. Aber ich habe nur nach der einfachsten Antwort gesucht :) Was passiert, wenn Sie davon ausgehen, dass der falsche Begriff normalverteilt ist. Dass dies nun sehr oft in der Realität vorkommt, geht aus den anderen Antworten hervor! Danke vielmals!
MarkDollar
17

Die kurze Antwort lautet, dass Sie keine Schlussfolgerung über die Verteilung von , da dies von der Verteilung der x und der Stärke und Form der Beziehung abhängt . Formal y eine „Mischung von Normalen“ Verteilung hat, die wie alles in der Praxis recht sein können.yxy

Hier sind zwei extreme Beispiele, um dies zu veranschaulichen:

  1. Angenommen, es gibt nur zwei mögliche Werte, 0 und 1, und y = 10 x + N ( 0 , 1 ) . Dann hat y eine stark bimodale Verteilung mit Erhebungen bei 0 und 10.xy=10x+N(0,1)y
  2. Nehmen Sie nun die gleiche Beziehung an, aber lassen Sie gleichmäßig auf das Intervall 0-1 mit vielen Werten verteilt sein. Dann wird y fast gleichmäßig über das Intervall 0-10 verteilt (mit einigen halbnormalen Schwänzen an den Rändern).xy

Tatsächlich kann man, da jede Verteilung mit einer Mischung von Normalen beliebig gut angenähert werden kann, wirklich jede Verteilung für .y

Aniko
quelle
8
+1 Zur letzten Aussage: Ich habe einmal den Fehler gemacht, das auch zu denken. Mathematisch sind Sie richtig, aber in der Praxis ist es fast unmöglich, einen nicht differenzierbaren Spitzenwert mit Normalen (wie J- oder U-förmigen Verteilungen) anzunähern: Die Normalen sind an ihren Spitzenwerten einfach zu flach, um die Dichte in den Spitzenwerten zu erfassen. Sie brauchen viel zu viele Komponenten. Normalen sind gut für die Approximation von Verteilungen, deren PDFs sehr glatt sind.
whuber
1
@whuber Einverstanden. Ich würde nicht vorschlagen, für eine Verteilung in der Praxis eine Näherung für normale Gemische zu verwenden, ich habe nur versucht, ein extremes Gegenbeispiel zu geben.
Aniko
5

Wir erfinden den Fehlerbegriff, indem wir realen Daten ein fiktives Modell auferlegen. Die Verteilung des Fehlerterms hat keinen Einfluss auf die Verteilung der Antwort.

Wir gehen oft davon aus, dass der Fehler normal verteilt ist, und versuchen daher, das Modell so zu konstruieren, dass unsere geschätzten Residuen normal verteilt sind. Dies kann für einige Verteilungen von schwierig sein . In diesen Fällen könnte man sagen, dass die Verteilung der Antwort den Fehlerterm beeinflusst.y

Thomas Levine
quelle
2
„Wir versuchen oft , das Modell so , dass unsere Fehlerterm zu konstruieren normalverteilt“ - um genau zu sein, ich glaube , Sie beziehen sich auf die Reste . Dies sind Schätzwerte der Fehler - Terme auf die gleiche Weise , daß X β ist ein Schätzwert von E ( y ) = X β . Wir möchten, dass die Residuen normal aussehen, da wir dies zunächst für die Fehlerbedingungen angenommen haben. Wir "erfinden" den Fehlerbegriff, indem wir ein Modell angeben, das nicht passt. yXβ^Xβ^E(y)=Xβ
JMS
Ich stimme Ihrer Präzision zu, JMS. +1 und ich werde meine Antwort anpassen.
Thomas Levine
2

Wenn Sie die Antwort als ausschreiben, wobei m das "Modell" (die Vorhersage für y ) und e die "Fehler" sind, kann dies neu angeordnet werden, um y - m = e anzuzeigen . Das Zuweisen einer Verteilung für die Fehler entspricht also dem Anzeigen der Art und Weise, in der Ihr Modell unvollständig ist. Anders ausgedrückt: Es gibt an, inwieweit Sie nicht wissen, warum die beobachtete Reaktion der Wert war, der sie tatsächlich war, und nicht das, was das Modell vorhergesagt hat. Wenn Sie wüssten, dass Ihr Modell perfekt ist, würden Sie eine Wahrscheinlichkeitsverteilung mit der gesamten Masse auf Null für die Fehler zuweisen. Zuweisen eines N (

y=m+e
myeym=e besagt grundsätzlich, dass die Fehler in Einheiten von σ klein sind. Die Idee ist, dass die Modellvorhersagen für verschiedene Beobachtungen in ähnlichem Maße "falsch" sind und auf der Skala von σ "ungefähr richtig" sind. Im Gegensatz dazu ist eine alternative Zuordnung C a u c h y ( 0 , γ ), die besagt, dass die meisten Fehler klein sind, aber einige Fehler ziemlich groß - das Modell weist gelegentlich "Fehler" oder "Schocker" auf der Vorhersage der Antwort.N(0,σ2)σσCauchy(0,γ)

In gewissem Sinne ist die Fehlerverteilung eher mit dem Modell als mit der Antwort verbunden. Dies ist aus der Nichtidentifizierbarkeit der obigen Gleichung ersichtlich, denn wenn sowohl als auch e unbekannt sind, führt das Addieren eines beliebigen Vektors zu m und das Subtrahieren von e zu demselben Wert von y , y = m + e = ( m + b ) + ( e - b ) = m ' + e 'memeyy=m+e=(m+b)+(eb)=m+e. Die Zuordnung einer Fehlerverteilung und einer Modellgleichung besagt grundsätzlich, welche beliebigen Vektoren plausibler sind als andere.

Wahrscheinlichkeitslogik
quelle
"Das scheint seltsam, weil Sie y nur einmal und nur einmal beobachten werden (y ist der vollständige Vektor / Matrix / etc. Von Antworten). Wie kann dies" verteilt "werden? Meiner Ansicht nach kann es nur in einem imaginären Ensemble verteilt werden, Dies hat nichts mit Ihrer tatsächlich beobachteten Antwort zu tun. Zumindest ist eine solche Annahme, dass die Antwort "verteilt" wird, nicht überprüfbar. Ich bin verwirrt. Wollen Sie damit sagen, dass wir gegen H 1 : y f 1 testen können ? H0:yf0H1:yf1
JMS
nyiYxiY=Xβ+ϵϵY|β,X
@JMS - I think I might delete that first paragraph. I don't think it adds anything to my answer (besides confusion).
probabilityislogic
one of my favorite things to add to my answers :)
JMS