Ich weiß, dass dies die statistische Schlussfolgerung trüben würde, aber es geht mir wirklich nur darum, einem genauen Modell so nahe wie möglich zu kommen.
Ich habe eine dichotome Ergebnisvariable mit einer großen Anzahl dichotomer Prädiktoren. Ich denke, ich möchte versuchen, mit LASSO auszuwählen, welche Variablen in mein Modell aufgenommen werden sollen, und diese ausgewählten Variablen dann in eine Logit-Regression eingeben.
Gibt es etwas, das ich übersehen habe, wenn es um die Praktikabilität dieses Ansatzes geht?
model-selection
lasso
logit
EvKohl
quelle
quelle
Antworten:
Weitere Informationen finden Sie hier: http://web.stanford.edu/~hastie/glmnet/glmnet_alpha.html#intro
quelle
stata lasso logistic
ich nach google, bekomme ich als erstes Ergebnis homepages.ucl.ac.uk/~ucakgam/stata.html .Erstens gibt es keine Garantie dafür, dass ein lineares Wahrscheinlichkeitsmodell einem Logit-Modell sehr gut nahe kommt. Folglich ist die für eine ausgewählte Teilmenge von Variablen möglicherweise weniger für die andere geeignet.
Zweitens führt die Neuanpassung trotz der im ersten Schritt erfolgten Variablenauswahl überhaupt nicht zu einer Schrumpfung. Risiko einer ernsthaften Fehlkalibrierung und möglicherweise eines kleinen Verlusts an Diskriminierung.
quelle