GAMM mit null aufgeblasenen Daten

9

Ist es möglich, ein GAMM (Generalized Additive Mixed Model) für Daten ohne Inflation in R anzupassen?

Wenn nicht, ist es möglich, ein GAM (Generalized Additive Model) für Daten ohne Inflation mit einer negativen Binomial- oder Quasi-Poisson-Verteilung in R anzupassen? (Ich fand COZIGAM :: zigam- und mgcv: ziP- Funktionen für die Poisson-Verteilung)

Fabio Janoni
quelle

Antworten:

8

Neben mgcv und seinen null-aufgeblasenen Poisson-Familien ( ziP()und ziplss()) können Sie sich auch das brms- Paket von Paul-Christian Bürkner ansehen . Es kann für Verteilungsmodelle geeignet sein (wobei Sie mehr als nur den Mittelwert modellieren, in Ihrem Fall kann die Nullinflationskomponente des Modells ebenso wie die Zählfunktion als Funktion von Kovariaten modelliert werden).

Sie können Glättungen in jeden der linearen Prädiktoren (für den Mittelwert / die Anzahl, den Nullinflationsteil usw.) über s()und t2()Terme für einfache 1-d- oder isotrope 2-d-Splines bzw. anisotrope Tensorprodukt-Splines einfügen. Es unterstützt null aufgeblasene Binomial-, Poisson-, negative Binomial- und Beta-Verteilungen sowie null-aufgeblasene Beta-Verteilungen. Es gibt auch Hürdenmodelle für Poisson- und negative Binomialantworten (wobei der Zählteil des Modells eine abgeschnittene Verteilung ist, um keine weiteren Nullzählungen zu erzeugen).

brms passt diese Modelle mit STAN an , sodass sie vollständig Bayesianisch sind. Dazu müssen Sie jedoch eine Reihe neuer Schnittstellen erlernen, um relevante Informationen zu extrahieren. Es gibt jedoch mehrere Pakete, die Unterstützungsfunktionen nur für diese Aufgabe anbieten , und brms hat Hilfsfunktionen geschrieben, die diese sekundären Pakete verwenden. Sie müssen STAN installieren und einen C ++ - Compiler benötigen, da brms das mit R definierte Modell zur Auswertung in R in STAN-Code kompiliert.

Gavin Simpson
quelle
4

Das glmmTMBPaket bietet dies und ist in einem kürzlich erschienenen bioRxiv-Artikel beschrieben: Brooks et al. (2017). Modellierung von Zero-Inflated Count-Daten mitglmmTMB , bioRxiv, doi: 10.1101 / 132753 .

Gavin Simpson hat auch einen schönen Blog-Beitrag, der sich glmmTMBmit mgcvdiesem Zweck vergleichen lässt: Fitting Count und Zero-Inflated Count GLMMs mit mgcv .

Achim Zeileis
quelle
1
+1 Danke für den Link zu meinem Blogbeitrag. Das war ein lustiger, ablenkender Nachmittag, an dem ich mit neuen Paketen spielte.
Gavin Simpson
Vielen Dank auch für den Hinweis, der in brmsder Tat sehr schön und flexibel ist. Zusammen mit Niki Umlauf habe ich auch geplant, einige Zählfamilien zu schreiben bamlss, um weitere flexible Regressionsfunktionen zu erhalten ... aber bisher sind wir nicht dazu gekommen, Datenverteilungen zu zählen.
Achim Zeileis