Bei kontinuierlichen Daten nimmt eine lineare Regression an, dass der Fehlerterm N (0, ) verteilt ist.σ 2
1) Nehmen wir an, dass Var (Y | x) ebenfalls ~ N (0, ) ist?
2) Wie ist diese Fehlerverteilung bei der logistischen Regression? Wenn die Daten in Form von 1 Datensatz pro Fall vorliegen, wobei "Y" 1 oder 0 ist, ist der Fehlerterm Bernoulli verteilt (dh die Varianz ist p (1-p)) und wenn die Daten in der Form # vorliegen Erfolge aus # von Versuchen, wird Binomial angenommen (dh Varianz ist np (1-p)), wobei p die Wahrscheinlichkeit ist, dass Y 1 ist?
logistic
generalized-linear-model
B_Miner
quelle
quelle
Antworten:
1) Wenn eine Normalverteilung hat, dh dann ist , da ist keine Zufallsvariable.N ( 0 , σ 2 ) V a r ( Y | X 2 ) = V a r ( β 1 + β 2 X 2 ) + V a r ( u ) = 0 + σ 2 = σ 2 β 1 + β 2 X 2u N.( 0 , σ2) V.a r ( Y.| X.2) = V.a r ( β1+ β2X.2) + V.a r ( u ) = 0 + σ2= σ2 β1+ β2X.2
2) Bei der logistischen Regression wird angenommen, dass die Fehler einer Binomialverteilung folgen, wie hier erwähnt . Es ist besser, es als zu schreiben , da diese Wahrscheinlichkeiten von abhängen , wie hier oder in Applied Logistic Regression angegeben .X jV.a r ( Y.j| X.j) = mj. E.[ Y.j| X.j] . ( 1 - E.[ Y.j| X.j] ) = mjπ( X.j) . ( 1 - π( X.j) ) X.j
quelle