Wie ist die Interpretation der Zahl, die die logistische Regressionsfunktion ausgibt?
Die logistische Funktion
(wobei eine lineare Funktion ist) soll eine kontinuierliche Variable (oder allgemeiner eine ganze Reihe vollständig geordneter Variablen) zwischen 0 und 1 abbilden.
Ich habe immer angenommen, dass es die Wahrscheinlichkeit ist, in den einen oder anderen Satz aufgenommen zu werden. Der Bereich ist (naja, vielleicht nicht 0 und 1), was eine Wahrscheinlichkeit ist. Und ehrlich gesagt alles zwischen 0 und 1, was könnte es anders sein als eine Wahrscheinlichkeit.
Aber als ich die Kurve betrachtete, begann ich zu zweifeln. Ich fragte mich, ob es unbedingt als Wahrscheinlichkeit zu interpretieren ist. Es sieht aus wie eine Wahrscheinlichkeit, aber ist es wirklich? Nur weil sie den gleichen Bereich teilen, heißt das nicht, dass sie gleich sind. Wenn , bedeutet das wirklich, dass von kleiner als ?
Dies könnte in zwei Richtungen gehen:
Angenommen, es handelt sich um eine Wahrscheinlichkeit oder genauer um die Wahrscheinlichkeit einer "wahren", "1" oder "positiven" Klassifizierung eines Punkts in der Domäne. Wie ist das gerechtfertigt?
Angenommen, nicht. Was ist es dann genau und warum? Wie weit ist es von einer Wahrscheinlichkeit entfernt (numerisch und konzeptionell)?
Eine andere Möglichkeit, dies zu sagen, ist das Besondere an . Warum nicht eine monoton ansteigende ungerade (ungefähr ) Funktion mit demselben Bereich wie oder (sehr nahe, aber nicht gleich der logistischen Funktion)
oder offen gesagt ?
quelle
Antworten:
Die logistische Regression, wie sie in den letzten Jahrzehnten verstanden wurde, wird explizit als Modell für Bernoulli- oder Binomialdaten (mit Erweiterungen in andere Fälle wie Multinomialdaten) verwendet, wobei das Modell für den Parameter tatsächlich eine Wahrscheinlichkeit ist.p
Die logistische Regression hat jedoch ihren Ursprung in der Modellierung des zeitlichen Wachstums eines Anteils [1] (der kontinuierlich sein kann), sodass sie in ihren Ursprüngen eine enge Verbindung zu nichtlinearen Modellen aufweist, die zu logistischen Wachstumskurven passen
Nun, etwas zwischen 0 und 1 könnte ein Modell sein, ein kontinuierlicher Bruchteil wie der Anteil von Substanz A in einer Mischung von Dingen. Kann eine logistische Regression so etwas modellieren? Das Modell für den Mittelwert macht Sinn, aber das Modell für die Varianz macht nicht unbedingt Sinn; In der logistischen Regression hat die Varianzfunktion die Form . Dies hängt direkt mit der Varianz eines Bernoulli zusammen.μ(1−μ)
Man könnte jedoch (zum Beispiel) in Betracht ziehen, etwas wie ein Beta (dessen Varianzfunktion proportional zu ) durch ein quasi-binomiales Modell zu approximieren ; dann würden wir nicht unbedingt eine Wahrscheinlichkeit als solche modellieren, aber wir würden wahrscheinlich immer noch die logistische Regression verwenden, um dies zu tun.μ(1−μ)
Während es fast immer als Modell für eine Wahrscheinlichkeit gedacht ist, muss es nicht unbedingt sein.
Ich verstehe die Frage hier nicht. Wenn es explizit ein Modell für in einem Bernoulli ist, welche zusätzliche Rechtfertigung suchen Sie? Natürlich kann die Link-Funktion falsch sein (obwohl dies keine große Schwierigkeit ist - da andere Links verwendet werden könnten - würden wir keine logistische Regression mehr durchführen).p
[1]: Cramer, JS (2002),
"The Origins of Logistic Regression",
Tinbergen Institute, Dezember
http://papers.tinbergen.nl/02119.pdf
quelle