Ich habe es wahrscheinlich mit einem Problem zu tun, das wahrscheinlich schon hundert Mal gelöst wurde, aber ich bin mir nicht sicher, wo ich die Antwort finden kann.
Bei Verwendung der logistischen Regression werden bei vielen Funktionen und versuchen , einen binären kategorischen Wert vorherzusagen , y , ich bin daran interessiert , einen Teil der Funktionen bei der Auswahl , die vorhersagt gut.
Gibt es ein ähnliches Verfahren wie das Lasso? (Ich habe nur das Lasso gesehen, das für die lineare Regression verwendet wird.)
Zeigt die Betrachtung der Koeffizienten des angepassten Modells die Bedeutung der verschiedenen Merkmale an?
Bearbeiten - Erläuterungen Nachdem Sie einige der Antworten gesehen haben:
Wenn ich mich auf die Größe der angepassten Koeffizienten beziehe, meine ich diejenigen, die an normalisierte Merkmale (Mittelwert 0 und Varianz 1) angepasst sind. Andernfalls würde 1000x, wie @probabilityislogic hervorhob, weniger wichtig erscheinen als x.
Ich bin nicht daran interessiert, einfach die beste k-Teilmenge zu finden (wie @Davide angeboten hat), sondern die Bedeutung verschiedener Funktionen im Verhältnis zueinander abzuwägen. Beispielsweise könnte ein Merkmal "Alter" und das andere Merkmal "Alter> 30" sein. Ihre inkrementelle Bedeutung mag gering sein, aber beide mögen wichtig sein.
quelle
Die Antwort auf Ihre letzte Frage ist ein flaches NEIN. Die Größe der Koeffizienten ist in keiner Weise ein Maß für die Bedeutung. Das Lasso kann zur logistischen Regression verwendet werden. Sie müssen das Gebiet genauer studieren. Die Methoden, die Sie studieren müssen, beinhalten "bestrafte" Methoden. Wenn Sie nach Erkennungsmethoden suchen, die "schattierte" Prädiktoren aufdecken, ein Begriff, der möglicherweise irgendwo definiert ist, aber nicht allgemein verwendet wird, müssen Sie nach Methoden suchen, die Interaktionen und nichtlineare Strukturen innerhalb des Prädiktorraums und des Prädiktors untersuchen Ergebnisverknüpfung zu diesem Raum. In Frank Harrells Text "Regression Modeling Strategies" werden diese Probleme und Methoden ausführlich diskutiert.
Die Rückwärtsauswahlstrategie liefert keine gültigen Ergebnisse (obwohl sie Ergebnisse liefert). Wenn Sie sich einen Fall von 20 zufälligen Prädiktoren für 100 Ereignisse angesehen haben, werden Sie wahrscheinlich 2 oder 3 finden, die mit einem Rückwärtsauswahlverfahren ausgewählt werden. Die Verbreitung der Rückwärtsauswahl in der realen Welt spiegelt nicht sorgfältige statistische Überlegungen wider, sondern vielmehr die einfache Verfügbarkeit in SAS und SPSS und die mangelnde Komplexität der Benutzerbasis dieser Produkte. Die R-Benutzerbasis hat es schwerer, auf solche Methoden und Benutzer zuzugreifen, die Anforderungen auf den Mailinglisten veröffentlichen, und SO werden sie im Allgemeinen über die Probleme informiert, die mit Rückwärts- (oder Vorwärts-) Auswahlmethoden verbunden sind.
quelle
Englisch ist nicht meine Muttersprache, daher habe ich möglicherweise nicht verstanden, was Ihr Problem ist. Wenn Sie jedoch das beste Modell finden müssen, können Sie versuchen, ein Rückwärtsverfahren zu verwenden (und schließlich Interaktionen hinzuzufügen), beginnend mit einem Modell mit allen Kovariaten. Sie können dann sowohl die Residuen_vs_predicted-Werte als auch die qq-Plot-Diagramme betrachten, um zu überprüfen, ob das Modell Ihr Phänomen gut beschreibt
quelle