Warum ist R Squared mit LASSO kein gutes Maß für Regressionen?

12

Ich habe an mehreren Stellen gelesen, dass R Squared kein ideales Maß ist, wenn ein Modell mit LASSO angepasst wird. Mir ist jedoch nicht klar, warum das so ist.

Können Sie außerdem die beste Alternative empfehlen?

Dave
quelle

Antworten:

19

Das Ziel der Verwendung von LASSO besteht darin, eine spärliche Darstellung (einer vorhergesagten Menge) in dem Sinne zu erhalten, dass nicht viele Kovariaten vorhanden sind. Der Vergleich von Modellen mit tendiert dazu, Modelle mit vielen Kovariaten zu bevorzugen: Tatsächlich wird das Hinzufügen von Kovariaten, die nicht mit dem Ergebnis zusammenhängen, R 2 niemals verringern und fast immer zumindest ein wenig erhöhen. Das LASSO-Modell identifiziert das Modell mit der optimalen bestraften Log-Wahrscheinlichkeit (eine nicht bestrafte Log-Wahrscheinlichkeit ist monoton mit dem R 2 verbunden ). Validierungsstatistiken, die häufiger zum Vergleich von LASSO-Modellen mit anderen Modelltypen verwendet werden, sind beispielsweise der BIC oder das kreuzvalidierte R 2 .R.2R.2R.2R.2

AdamO
quelle
1
+1 für klar den Grund präsentieren und Alternative bieten
Haitao Du
1
Vielen Dank für die tolle Antwort! Würde es Ihnen etwas ausmachen, näher auf "Das LASSO-Modell wird das Modell mit der optimalen bestraften Log-Wahrscheinlichkeit identifizieren (eine nicht bestrafte Log-Wahrscheinlichkeit ist monoton mit dem R2 verbunden)." Ich verstehe den ersten Teil so, dass er das Modell mit der geringsten Fehlermenge auswählt (bei der Vorhersage und über die Bestrafung). Aber ich bin mir nicht sicher, was das Bit in Klammern bedeutet. Bedeutet das, dass nicht bestraftes LL steigt, wenn R2 sinkt? Muss sich das kreuzvalidierte R2 in einem völlig neuen Datensatz befinden? Oder kann es auf den Trainingsdaten basieren?
Dave
3
Log(2π)N.+1- -Log(N.)+Log(ich=1nrich2)1- -ich=1nrich2/.ich=1nyich2. Die Bestrafung trägt indirekt zum Fehler bei. Es ist ein Preis, den Sie zahlen, um die Spärlichkeit durchzusetzen. Das nicht bestrafte Modell weist immer einen geringeren (internen) Fehler auf. Personen führen im Allgemeinen eine Kreuzvalidierung mit demselben Datensatz durch. Das Testen von Modellen in neuen Datensätzen ist eine ganz andere Sache (der "Kreuz" -Teil ist nicht erforderlich) und wird nicht genug durchgeführt.
AdamO
@AdamO Ich denke, es wäre eine gute Idee, Ihren Kommentar in Ihre Antwort umzuwandeln. Es ist sehr gut.
Matthew Drury
Hallo @AdamO, eine letzte Frage. Ich verstehe jetzt, warum traditionelles R2 eine schlechte Maßnahme ist. Ich bin mir jedoch nicht sicher, warum eine Kreuzvalidierung von R2 (innerhalb desselben Datensatzes) in Ordnung ist.
Dave