Wie zeichnet man die Entscheidungsgrenze in R für ein logistisches Regressionsmodell?

15

Ich habe mit glm in R ein logistisches Regressionsmodell erstellt. Ich habe zwei unabhängige Variablen. Wie kann ich die Entscheidungsgrenze meines Modells im Streudiagramm der beiden Variablen darstellen? Wie kann ich beispielsweise eine Abbildung wie die folgende zeichnen: http://onlinecourses.science.psu.edu/stat557/node/55

Vielen Dank.

user2755
quelle
2
Der Link zur Figur ist tot.
Nick Stauner

Antworten:

24
set.seed(1234)

x1 <- rnorm(20, 1, 2)
x2 <- rnorm(20)

y <- sign(-1 - 2 * x1 + 4 * x2 )

y[ y == -1] <- 0

df <- cbind.data.frame( y, x1, x2)

mdl <- glm( y ~ . , data = df , family=binomial)

slope <- coef(mdl)[2]/(-coef(mdl)[3])
intercept <- coef(mdl)[1]/(-coef(mdl)[3]) 

library(lattice)
xyplot( x2 ~ x1 , data = df, groups = y,
   panel=function(...){
       panel.xyplot(...)
       panel.abline(intercept , slope)
       panel.grid(...)
       })

Alt-Text

Ich muss erwähnen, dass hier eine perfekte Trennung stattfindet, daher glmgibt die Funktion eine Warnung. Dies ist jedoch hier nicht wichtig, da der Zweck darin besteht, zu veranschaulichen, wie die lineare Grenze und die Beobachtungen entsprechend ihren Kovariaten gefärbt werden.

suncoolsu
quelle
Ich hoffe ich bin nicht altmodisch wenn ich Gitter benutze :-)
suncoolsu 13.01.11
2
Ich hoffe auch, dass, wenn dies ein HW-Problem ist, Sie nicht einfach kopieren, einfügen.
Suncoolsu
Vielen Dank. Dies ist keine HW-Frage und die Antwort ist hilfreich, um mein Modell zu verstehen.
user2755
oh ja du bist :)
mpiktas
1
Kann mir jemand die Logik hinter dem Hang erklären und abfangen? (in Bezug auf das logistische Modell)
Fernando
22

Wollte die Frage im Kommentar an die oben akzeptierte Antwort von Fernando adressieren: Kann jemand die Logik hinter dem Abhang erklären und abfangen?

Die Hypothese für die logistische Regression lautet:

hθ=G(z)

G(z)z die Form hat:

z=θ0+θ1x1+θ2x2

Da wir zwischen 0 und 1 klassifizieren, y=1 wann hθ0,5 was angesichts der Sigmoid-Funktion wahr ist, wenn:

θ0+θ1x1+θ2x20

Das Obige ist die Entscheidungsgrenze und kann wie folgt umgeordnet werden:

x2-θ0θ2+-θ1θ2x1

Dies ist eine Gleichung in Form von y=mx+b und du kannst dann sehen warum m und b werden so berechnet, wie sie in der akzeptierten Antwort stehen

Andy
quelle
2
Gute Erklärung zur obigen Antwort!
Augustin