Bestrafte Modelle können verwendet werden, um Modelle zu schätzen, bei denen die Anzahl der Parameter gleich oder sogar größer als die Stichprobengröße ist. Diese Situation kann in logarithmisch linearen Modellen großer, spärlicher Tabellen mit kategorialen oder Zähldaten auftreten. In diesen Einstellungen ist es häufig auch wünschenswert oder hilfreich, Tabellen zu reduzieren, indem Ebenen eines Faktors kombiniert werden, bei denen diese Ebenen nicht in Bezug auf die Interaktion mit anderen Faktoren unterscheidbar sind. Zwei Fragen:
- Gibt es eine Möglichkeit, bestrafte Modelle wie LASSO oder elastisches Netz zu verwenden, um die Kollabierbarkeit von Ebenen innerhalb jedes Faktors zu testen?
- Wenn die Antwort auf die erste Frage Ja lautet, kann und sollte dies so eingerichtet werden, dass der Zusammenbruch von Ebenen und die Schätzung von Modellkoeffizienten in einem einzigen Schritt erfolgen?
Antworten:
Es ist möglich. Wir können eine Variante des verschmolzenen Lassos verwenden , um dies zu erreichen.
Wir können den Schätzer
Beachten Sie, dass die Verlustfunktion für log-linear ist Modelle.−1n∑ni=1(yiβTxi−eβTxi)
Dies ermutigt die Koeffizienten innerhalb einer Gruppe, gleich zu sein. Diese Gleichheit der Koeffizienten entspricht dem Zusammenfallen der Ebenen und des Faktors. Wenn , entspricht dies dem Reduzieren der Ebene mit der Referenzstufe. Die können als konstant behandelt werden. Wenn jedoch nur wenige Faktoren vorhanden sind, ist es möglicherweise besser, sie als separat zu behandeln. k t h β j = 0 j t h λ gjth kth β^j=0 jth λg
Der Schätzer ist ein Minimierer einer konvexen Funktion, sodass er über beliebige Löser effizient berechnet werden kann. Es ist möglich, dass, wenn ein Faktor viele, viele Ebenen hat, diese paarweisen Unterschiede außer Kontrolle geraten - in diesem Fall ist es notwendig, mehr Struktur über mögliche Kollapsmuster zu wissen.
Beachten Sie, dass dies alles in einem Schritt erledigt wird! Dies ist ein Teil dessen, was Lasso-Schätzer so cool macht!
Ein weiterer interessanter Ansatz ist die Verwendung des OSCAR-Schätzers, der wie oben beschrieben ist, mit der Ausnahme, dass die Strafe durch .∥[−11]⋅[βiβj]′∥1 ∥[βiβj]∥∞
quelle