Warum wird die logistische Regressionshypothese als Wahrscheinlichkeitsfunktion angesehen?
Ich verstehe, dass wir es verwenden, um 0 oder 1 vorherzusagen, aber warum kann eine Funktion (die Hypothese), die Zahlen zwischen 0 und 1 ausgibt, als Wahrscheinlichkeitsfunktion betrachtet werden?
Ist das eine Heuristik?
regression
logistic
generalized-linear-model
user_anon
quelle
quelle
Antworten:
Nein, es ist nicht nur eine Heuristik.
Die logistische Regression ist ein besonderer Fall eines verallgemeinerten linearen Modells (GLM), in diesem Fall für einen Prozess, bei dem die Antwortvariable bedingt Bernoulli (oder allgemeiner Binomial ) ist.
Ein GLM enthält eine Spezifikation eines Modells für das bedingte Mittel der Antwort. Im Fall einer Bernoulli-Variablen ist ihr bedingter Mittelwert der Parameterpich , das ist explizit die Wahrscheinlichkeit, dass die Antwort, Y.ich ist 1 . Es wird anhand eines oder mehrerer Prädiktoren modelliert. Hier ist das Modell für den Mittelwert für einen einzelnen Prädiktor:xich ::
Es ist also (absichtlich) ein Modell für die Wahrscheinlichkeit, dass die Antwort ist1 gegeben angesichts des Wertes der Prädiktoren.
Die Form der Verknüpfungsfunktionη= log( p / ( 1 - p ) ) (und seine Umkehrung p = exp( η) / ( 1 + exp( η) ) ) ist auch kein Zufall - der Logit-Link (was ihn zur logistischen Regression macht) ist die natürliche (oder kanonische ) Link-Funktion für eine Binomialantwort. Andere Auswahlmöglichkeiten für die Verknüpfungsfunktion sind möglich (und sie werden auch Modelle für die Wahrscheinlichkeit einer 1 sein). Andere gebräuchliche Optionen für eine Binomialantwort sind das Probit und das komplementäre Log-Log, aber die Logistik ist bei weitem die häufigste.
quelle