Verstehen der Vorhersagen aus der logistischen Regression

13

Meine Vorhersagen aus einem logistischen Regressionsmodell (glm in R) sind nicht wie erwartet zwischen 0 und 1 begrenzt. Mein Verständnis der logistischen Regression ist, dass Ihre Eingabe- und Modellparameter linear kombiniert werden und die Antwort mithilfe der Logit-Link-Funktion in eine Wahrscheinlichkeit umgewandelt wird. Da die Logit-Funktion zwischen 0 und 1 liegt, habe ich erwartet, dass meine Vorhersagen zwischen 0 und 1 liegen.

Das sehe ich jedoch nicht, wenn ich logistische Regression in R implementiere:

data(iris)
iris.sub <- subset(iris, Species%in%c("versicolor","virginica"))
model    <- glm(Species ~ Sepal.Length + Sepal.Width, data = iris.sub, 
                family = binomial(link = "logit"))
hist(predict(model))

Bildbeschreibung hier eingeben

Wenn überhaupt, sieht die Ausgabe von predict (model) für mich normal aus. Kann mir jemand erklären, warum die Werte, die ich erhalte, keine Wahrscheinlichkeiten sind?

Adrian
quelle
3
Corones Antwort unten deckt die Details sehr gut ab. Die ursprüngliche Zahl, die Sie oben haben, zeigt die Log-Odds-Werte auf der x-Achse, die mathematisch in Wahrscheinlichkeiten umgewandelt werden können (dh gemäß Corones Antwort, indem Sie die Link-Funktion erneut durchlaufen.)
James Stanley

Antworten:

16

Das predict.glm Methode gibt standardmäßig die Prädiktoren auf der Skala des linearen Prädiktors zurück. Dh sie haben die Linkfunktion noch nicht durchlaufen.

Versuchen

hist(predict(model, type = "response"))

stattdessen

Bildbeschreibung hier eingeben

Corone
quelle
4
Sie haben unsere Markup- und Illustrationsfähigkeiten in kurzer Zeit hervorragend beherrscht: Diese Antwort ist ein gutes Beispiel dafür. Gut gemacht!
Whuber