Ich würde gerne die Unterschiede zwischen Randomized Logistic Regression (RLR) und Plain Logistic Regression (LR) kennenlernen, daher lese ich eine Arbeit "Stability Selection" von Meinshausen, et al. ; Ich verstehe jedoch nicht, was RLR ist und was die Unterschiede zwischen RLR und LR sind.
Könnte jemand darauf hinweisen, was ich lesen sollte, um RLR zu verstehen? Oder gibt es zunächst ein einfaches Beispiel?
machine-learning
logistic
Hendra Bunyamin
quelle
quelle
Antworten:
Vielleicht möchten Sie diese Referenz überprüfen . Sci-Kit Learn implementiert eine randomisierte logistische Regression und die Methode wird dort beschrieben.
Um Ihre Frage zu beantworten, unterscheiden sich die beiden Methoden stark in ihren Zielen. Bei der logistischen Regression geht es darum, ein Modell anzupassen, und bei RLR geht es darum, die Variablen zu finden, die in das Modell einfließen.
Die logistische Vanille-Regression ist ein verallgemeinertes lineares Modell. Für eine binäre Antwort nehmen wir an, dass die logarithmische Wahrscheinlichkeit der Antwort eine lineare Funktion einer Reihe von Prädiktoren ist. Die Koeffizienten der Prädiktoren werden unter Verwendung der maximalen Wahrscheinlichkeit geschätzt, und die Inferenz über die Parameter basiert dann auf den Eigenschaften großer Stichproben des Modells. Für die besten Ergebnisse wird normalerweise davon ausgegangen, dass das Modell recht einfach und gut verständlich ist. Wir wissen, welche unabhängigen Variablen die Reaktion beeinflussen. Wir wollen die Parameter des Modells schätzen.
In der Praxis wissen wir natürlich nicht immer, welche Variablen in das Modell einbezogen werden sollen. Dies gilt insbesondere für Situationen des maschinellen Lernens, in denen die Anzahl der potenziellen erklärenden Variablen sehr groß und ihre Werte gering sind.
Im Laufe der Jahre haben viele Menschen versucht, die Techniken der statistischen Modellanpassung zum Zweck der variablen Auswahl ("Merkmalauswahl") zu verwenden. Mit zunehmender Zuverlässigkeit:
quelle