Können (sollten?) Regularisierungstechniken in einem Zufallseffektmodell verwendet werden?

11

Mit Regularisierungstechniken beziehe ich mich auf Lasso, Gratregression, elastisches Netz und dergleichen.

Stellen Sie sich ein Vorhersagemodell für Gesundheitsdaten vor, das demografische Daten und Diagnosedaten enthält, bei denen die Aufenthaltsdauer für stationäre Aufenthalte vorhergesagt wird. Für einige Personen gibt es mehrere LOS-Beobachtungen (dh mehr als eine IP-Episode) während des Basiszeitraums, die korreliert sind.

Ist es sinnvoll, beispielsweise ein elastisches Netzvorhersagemodell zu erstellen, das für jedes Individuum einen zufälligen Effektabfangterm enthält?

multiple-regression random-effects-model regularization RobertF
quelle

Untertitel für Ihre erste Zeile: "Durch Zufallseffekttechniken (dh Annahmen darüber, wie ein Parameter zufällig verteilt wird) beziehe ich mich auf Laplace-Priors und Normal-Priors für Regressionsparameter ... und dergleichen" :-)

Conjugateprior

7

Es gibt einige Artikel, die sich mit dieser Frage befassen. Ich würde in keiner besonderen Reihenfolge nachschlagen:

Pen.LME: Howard D. Bondell, Arun Krishna und Sujit K. Ghosh. Gemeinsame Variablenauswahl für feste und zufällige Effekte in linearen Mischeffektmodellen. Biometrics, 66 (4): 1069 & ndash; 1077, 2010.
GLMMLASSO: Jürg Schelldorfer, Peter Bühlmann, Sara van de Geer. Schätzung für hochdimensionale lineare Mischeffektmodelle unter Verwendung der L1-Bestrafung. Scandinavian Journal of Statistics, 38 (2): 197-214, 2011.

welches online gefunden werden kann.

Ich bin gerade dabei, ein Papier über die Anwendung einer elastischen Nettostrafe auf das gemischte Modell (LMMEN) fertigzustellen und plane, es im kommenden Monat zur Überprüfung durch das Journal zu senden.

LMMEN: Sidi, Ritov, Unger. Regularisierung und Klassifizierung linearer gemischter Modelle über die Elastic Net Penalty

Wenn Sie Daten modellieren, die entweder nicht normal sind oder keine Identitätsverknüpfung haben, würde ich mich für GLMMLASSO entscheiden (aber Vorsicht, es können nicht viele REs verarbeitet werden). Ansonsten ist Pen.LME gut, da Sie keine stark korrelierten Daten haben, sei es in den festen oder zufälligen Effekten. Im letzteren Fall können Sie mir eine E-Mail senden, und ich würde Ihnen gerne Code / Papier zusenden (ich werde es in naher Zukunft auf den Kran legen).

Ich habe heute auf CRAN hochgeladen - lmmen . Es löst das lineare gemischte Modellproblem mit einer Strafe vom Typ eines elastischen Netzes für die festen und zufälligen Effekte gleichzeitig.

Das Paket enthält auch CV- Funktionen für die Pakete lmmlasso und glmmLasso .

Yonicd
quelle

1

Yonicd, die Anwendung eines elastischen Netzes auf lineare gemischte Modelle ist genau das, wonach ich suche. Ich arbeite mit genetischen Daten, die korreliert sind, daher wäre die gruppierte Auswahl eines elastischen Netzes sehr nützlich. Ich habe versucht, Sie zu kontaktieren, aber keinen anderen Weg gefunden, als diese Antwort zu veröffentlichen, da es unmöglich erscheint, eine Nachricht zu senden. Wie auch immer, ich freue mich darauf, Ihre Zeitung zu lesen und werde Ihren Code ausprobieren, sobald er verfügbar ist.

5

Ich habe die Gratregression immer nur als empirische Zufallseffektmodelle angesehen, die nicht auf eine einzelne kategoriale Variable (und keine ausgefallenen Korrelationsmatrizen) beschränkt sind. Sie können fast immer die gleichen Vorhersagen erhalten, wenn Sie eine Gratstrafe kreuzvalidieren und einen einfachen Zufallseffekt anpassen / schätzen. In Ihrem Beispiel könnten Sie ausgefallen sein und eine separate Ridge-Strafe für die Demo / Diag-Funktionen und eine andere für die Patientenindikatoren erhalten (unter Verwendung einer Linie, die den Straf-Skalierungsfaktor einschließt glmnet). Alternativ können Sie einen ausgefallenen Zufallseffekt einschließen, der zeitkorrelierte Effekte pro Person hat. Keine dieser Möglichkeiten ist richtig oder falsch, sie sind nur nützlich.

Shea Parkes
quelle

2

Ich denke gerade über eine ähnliche Frage nach. Ich denke, in der Anwendung können Sie es tun, wenn es funktioniert und Sie glauben, dass dies vernünftig ist. Wenn es sich um eine übliche Einstellung für zufällige Effekte handelt (dh Sie haben wiederholte Messungen für jede Gruppe), handelt es sich nur um eine Schätztechnik, die weniger kontrovers ist. Wenn Sie für die meisten Gruppen tatsächlich nicht viele wiederholte Messungen haben, liegt diese möglicherweise an der Grenze des üblichen Zufallseffektmodells, und Sie möchten möglicherweise seine Gültigkeit (aus methodischer Sicht) sorgfältig begründen, wenn Sie es allgemein vorschlagen möchten Methode.

ltx5151
quelle

Können (sollten?) Regularisierungstechniken in einem Zufallseffektmodell verwendet werden?

Antworten: