Ich regressiere einen kontinuierlichen Prädiktor für über 60 Variablen (sowohl kontinuierlich als auch kategorial) mit LASSO (glmnet).
Bei der Untersuchung des variablen Trace-Diagramms stelle ich fest, dass eine der Schlüsselvariablen mit zunehmendem log Lambda einen Koeffizienten aufweist, der tatsächlich zunimmt. Dann, nach einem bestimmten Punkt, beginnt es abzunehmen, wie wir es erwarten würden.
Um sicherzustellen, dass dies kein Zufall war, habe ich 10 Modelle mit Bootstraps ausgeführt und sehr ähnliche Ergebnisse erzielt.
Ist das möglich oder liegt ein Problem mit den Daten vor? Wenn legitim, was sagt uns dieser Trend im Koeffizienten der Variablen über die Variable und die Beziehung zur Antwort aus?
quelle