LASSO Annahmen

In einem LASSO-Regressionsszenario, in dem

$y= X \beta + \epsilon$ ,

und die LASSO-Schätzungen sind durch das folgende Optimierungsproblem gegeben

$\min_\beta ||y - X \beta|| + \tau||\beta||_1$

Gibt es irgendwelche Verteilungsannahmen bezüglich des $\epsilon$ ?

In einem OLS-Szenario würde man erwarten, dass die $\epsilon$ unabhängig und normal verteilt sind.

Ist es sinnvoll, die Residuen in einer LASSO-Regression zu analysieren?

Ich weiß, dass die LASSO-Schätzung als posteriorer Modus unter unabhängigen doppelt exponentiellen Priors für $\beta_j$ . Aber ich habe keine Standard-Annahmenprüfphase gefunden.

Danke im Voraus (:

regression lasso assumptions residuals deps_stats
quelle

Antworten:

Ich bin kein Experte für LASSO, aber hier ist meine Meinung.

Beachten Sie zunächst, dass OLS ziemlich robust gegenüber Verletzungen der Unabhängigkeit und der Normalität ist. Ausgehend von Theorem 7 und der Diskussion darüber im Artikel Robust Regression und Lasso (von X. Huan, C. Caramanis und S. Mannor) denke ich, dass wir uns bei der LASSO-Regression eher nicht mit der Verteilung von befassen $\varepsilon_i$ , aber in der gemeinsamen Verteilung von $(y_i,x_i)$ . Der Satz basiert auf der Annahme, dass $(y_i,x_i)$ eine Stichprobe ist, was mit üblichen OLS-Annahmen vergleichbar ist. LASSO ist jedoch weniger restriktiv. Es beschränkt $y_i$ nicht darauf, aus dem linearen Modell generiert zu werden.

Zusammenfassend lautet die Antwort auf Ihre erste Frage nein. Es gibt keine Verteilungsannahmen für , alle Verteilungsannahmen gelten für . Außerdem sind sie schwächer, da in LASSO nichts von einer bedingten Verteilung abhängig ist . $\varepsilon$ $(y,X)$ $(y|X)$

Die Antwort auf die zweite Frage lautet dann auch nein. Da das keine Rolle spielt, ist es nicht sinnvoll, sie so zu analysieren, wie Sie sie in OLS analysieren (Normalitätstests, Heteroskedastizität, Durbin-Watson usw.). Sie sollten sie jedoch im Kontext analysieren, wie gut die Modellanpassung war. $\varepsilon$

mpiktas
quelle