Ich benutze das R-Paket bestraft , um geschrumpfte Koeffizientenschätzungen für einen Datensatz zu erhalten, bei dem ich viele Prädiktoren und wenig Wissen darüber habe, welche wichtig sind. Gibt es, nachdem ich die Abstimmungsparameter L1 und L2 ausgewählt und mit meinen Koeffizienten zufrieden bin, eine statistisch fundierte Möglichkeit, die Modellanpassung mit so etwas wie R-Quadrat zusammenzufassen?
Außerdem bin ich daran interessiert, die Gesamtbedeutung des Modells zu testen (dh ist R² = 0 oder ist alles = 0).
Ich habe die Antworten auf eine ähnliche Frage gelesen, die hier gestellt wurde , aber meine Frage wurde nicht ganz beantwortet. Es gibt ein exzellentes Tutorial zum R-Paket, das ich hier verwende , und der Autor Jelle Goeman hatte am Ende des Tutorials den folgenden Hinweis zu Konfidenzintervallen von bestraften Regressionsmodellen:
Es ist eine sehr natürliche Frage, nach Standardfehlern von Regressionskoeffizienten oder anderen geschätzten Größen zu fragen. Grundsätzlich können solche Standardfehler einfach berechnet werden, z. B. mit dem Bootstrap.
Dieses Paket bietet sie jedoch absichtlich nicht an. Der Grund dafür ist, dass Standardfehler für stark verzerrte Schätzungen, wie sie sich aus strafbaren Schätzmethoden ergeben, nicht sehr aussagekräftig sind. Die bestrafte Schätzung ist ein Verfahren, das die Varianz von Schätzern durch Einführung einer erheblichen Verzerrung verringert. Die Vorspannung jedes Schätzers ist daher eine Hauptkomponente seines mittleren quadratischen Fehlers, während seine Varianz möglicherweise nur einen kleinen Teil dazu beiträgt.
Leider ist es in den meisten Anwendungen der bestraften Regression nicht möglich, eine ausreichend genaue Schätzung der Verzerrung zu erhalten. Bootstrap-basierte Berechnungen können nur eine Einschätzung der Varianz der Schätzungen geben. Zuverlässige Schätzungen des Bias sind nur verfügbar, wenn zuverlässige unverzerrte Schätzungen verfügbar sind, was in Situationen, in denen bestrafte Schätzungen verwendet werden, normalerweise nicht der Fall ist.
Das Melden eines Standardfehlers einer bestraften Schätzung erzählt daher nur einen Teil der Geschichte. Es kann einen irrtümlichen Eindruck von großer Präzision geben, wobei die durch die Vorspannung verursachte Ungenauigkeit völlig ignoriert wird. Es ist sicherlich ein Fehler, Vertrauensaussagen zu machen, die nur auf einer Einschätzung der Varianz der Schätzungen beruhen, wie dies bei Bootstrap-basierten Vertrauensintervallen der Fall ist.
quelle
Antworten:
Meine erste Reaktion auf Jelles Kommentare ist "Bias-Schmias". Sie müssen vorsichtig sein, was Sie mit "große Anzahl von Prädiktoren" meinen. Dies könnte "groß" sein in Bezug auf:
Meine Reaktion basierte auf "groß" in Bezug auf Punkt 1. Dies liegt daran, dass es sich in diesem Fall in der Regel lohnt, die Abweichung für die Verringerung der Varianz, die Sie erhalten, auszugleichen. Vorspannung ist nur "auf lange Sicht" wichtig. Wenn Sie also eine kleine Stichprobe haben, wen interessiert dann "Langfristig"?
Idealerweise sollte dieser "Vorhersagefehler" auf dem Kontext Ihrer Modellierungssituation basieren. Grundsätzlich möchten Sie die Frage "Wie gut reproduziert mein Modell die Daten?" Beantworten. Der Kontext Ihrer Situation sollte Ihnen sagen können, was "wie gut" in der realen Welt bedeutet. Sie müssen dies dann in eine Art mathematische Gleichung übersetzen.
quelle
Das R-Paket hdm und das Stata-Paket lassopack unterstützen einen gemeinsamen Signifikanztest für das Lasso. Die Theorie sieht vor, dass die Anzahl der Prädiktoren im Verhältnis zur Anzahl der Beobachtungen groß ist. Die Theorie hinter dem Test und wie man ihn anwendet, wird in der hdm- Dokumentation kurz erklärt . Kurz gesagt, es basiert auf einem Rahmen für eine theoretisch motivierte Bestrafung (entwickelt von Belloni, Chernozhukov und Hansen et al.). Dieses Papier ist ein guter Ausgangspunkt, wenn Sie mehr über die zugrunde liegende Theorie erfahren möchten. Der einzige Nachteil ist, dass der Test nur für das Lasso und (Quadratwurzellasso) funktioniert. Nicht für andere bestrafte Regressionsmethoden.
Belloni, A., Chen, D., Chernozhukov, V. und Hansen, C. (2012), spärliche Modelle und Methoden für optimale Instrumente mit einer Anwendung auf bedeutende Gebiete. Econometrica, 80: 2369 & ndash; 2429.
quelle