Da es sich bei der logistischen Regression um ein statistisches Klassifizierungsmodell handelt, das sich mit kategorienabhängigen Variablen befasst, warum wird es nicht als logistische Klassifizierung bezeichnet ? Sollte der Name "Regression" nicht Modellen vorbehalten sein, die sich mit stetigen abhängigen Variablen befassen?
regression
machine-learning
logistic
classification
terminology
Ismael Ghalimi
quelle
quelle
Antworten:
Die logistische Regression ist nachdrücklich kein eigenständiger Klassifizierungsalgorithmus. Es ist nur ein Klassifizierungsalgorithmus in Kombination mit einer Entscheidungsregel, der die vorhergesagten Wahrscheinlichkeiten des Ergebnisses dichotom macht. Die logistische Regression ist ein Regressionsmodell, da sie die Wahrscheinlichkeit einer Klassenzugehörigkeit als (Transformation einer) multilinearen Funktion der Features schätzt.
Frank Harrell hat auf dieser Website eine Reihe von Antworten veröffentlicht, in denen die Fallstricke aufgezählt werden, die es mit sich bringt, logistische Regression als Klassifizierungsalgorithmus zu betrachten. Unter ihnen:
Wenn ich mich richtig erinnere, hat er mich einmal auf sein Buch über Regressionsstrategien hingewiesen, um diese (und noch mehr!) Punkte näher zu erläutern, aber ich kann diesen bestimmten Beitrag anscheinend nicht finden.
quelle
Abstrakt ist die Regression das Problem der Berechnung einer bedingten Erwartung . Die Form, die diese Erwartung annimmt, hängt von den Annahmen ab, wie die Daten generiert wurden:E[Y|X=x]
Der Begriff "Regression" wurde auch allgemeiner verwendet, einschließlich Ansätzen wie der Quantilregression, die ein gegebenes Quantil von schätzt .(Y|X=x)
quelle
Abgesehen von den bereits gegebenen guten Antworten ist eine andere Ansicht, dass die logistische Regression Wahrscheinlichkeiten (die ein kontinuierlicher Wert sind ) vorhersagt , die einen Bereich von 0 bis 1 haben.
quelle