Meine Vorhersagen aus einem logistischen Regressionsmodell (glm in R) sind nicht wie erwartet zwischen 0 und 1 begrenzt. Mein Verständnis der logistischen Regression ist, dass Ihre Eingabe- und Modellparameter linear kombiniert werden und die Antwort mithilfe der Logit-Link-Funktion in eine Wahrscheinlichkeit umgewandelt wird. Da die Logit-Funktion zwischen 0 und 1 liegt, habe ich erwartet, dass meine Vorhersagen zwischen 0 und 1 liegen.
Das sehe ich jedoch nicht, wenn ich logistische Regression in R implementiere:
data(iris)
iris.sub <- subset(iris, Species%in%c("versicolor","virginica"))
model <- glm(Species ~ Sepal.Length + Sepal.Width, data = iris.sub,
family = binomial(link = "logit"))
hist(predict(model))
Wenn überhaupt, sieht die Ausgabe von predict (model) für mich normal aus. Kann mir jemand erklären, warum die Werte, die ich erhalte, keine Wahrscheinlichkeiten sind?
Antworten:
Das
predict.glm
Methode gibt standardmäßig die Prädiktoren auf der Skala des linearen Prädiktors zurück. Dh sie haben die Linkfunktion noch nicht durchlaufen.Versuchen
hist(predict(model, type = "response"))
stattdessen
quelle