Fehlende Werte in der Antwortvariablen in JAGS

10

Gelman & Hill (2006) sagen:

In Bugs können fehlende Ergebnisse in einer Regression einfach behandelt werden, indem einfach der Datenvektor, die NAs und alle eingeschlossen werden. Bugs modellieren die Ergebnisvariable explizit. Daher ist es trivial, dieses Modell zu verwenden, um fehlende Werte bei jeder Iteration zu unterstellen.

Dies klingt nach einer einfachen Möglichkeit, JAGS zur Vorhersage zu verwenden. Aber wirken sich die Beobachtungen mit den fehlenden Ergebnissen auch auf Parameterschätzungen aus? Wenn ja, gibt es eine einfache Möglichkeit, diese Beobachtungen in dem von JAGS angezeigten Datensatz beizubehalten, ohne dass sie die Parameterschätzungen beeinflussen? Ich habe über die Schnittfunktion nachgedacht, aber diese ist nur in BUGS verfügbar, nicht in JAGS.

Jack Tanner
quelle

Antworten:

11

Ja, es ist wirklich einfach in BUGS oder JAGS zu verwenden! Es ist wirklich eine Freude, es zu benutzen!

Aber wirken sich die Beobachtungen mit den fehlenden Ergebnissen auch auf Parameterschätzungen aus?

Natürlich nicht. Die Parameter werden nur von den beobachteten Ergebnissen beeinflusst. Die fehlenden Ergebnisse (NAs) haben keinen Einfluss auf das Gegenteil. Die fehlenden Ergebnisse werden aus den Parametern abgeleitet. Beachten Sie, dass die fehlenden Ergebnisse auch nach hinten verteilt sind. Dann ist es sehr einfach, einige abgeleitete Größen zu berechnen, z. B. eine Summe über Indizes des Ergebnisses, und diese abgeleiteten Größen werden nicht nur für fehlende Werte behandelt, sondern haben auch sofort ihre hintere Verteilung. Das ist es, was bei BUGS & JAGS so sexy ist!

Habe Spaß!

Neugierig
quelle
1
Entschuldigung, ich bin nicht davon überzeugt, dass fehlende Ergebnisse die Parameterschätzungen nicht beeinflussen. Jackman scheint das Gegenteil zu sagen: jackman.stanford.edu/blog/?p=38
Jack Tanner
@ JackTanner, denk eine Weile darüber nach. Wie kann ein fehlender Wert etwas beeinflussen? Wenn der Algorithmus startet, wird der fehlende Wert aus den Parameterschätzungen berechnet (diese werden aus den beobachteten Ergebnissen abgeleitet). Dann (vielleicht bin ich mir nicht sicher) können die Informationen aus dem unterstellten fehlenden Ergebnis auf Parameter zurückspringen, aber es spielt keine Rolle - es sind nur die ursprünglichen Informationen, die in Parametern vorhanden sind und auf diese zurückgeworfen werden. Die REAL-Informationen, die etwas beeinflussen, stammen nur aus den REAL-Ergebnissen. Wenn Sie mir nicht vertrauen, machen Sie eine Simulation, vergleichen Sie die Ergebnisse und posten Sie hier.
Neugierig
In Bezug auf Ihren Link ist er sich anscheinend nicht sicher, er sagt "Problem" - in Anführungszeichen und er sagt "es wäre interessant, es zu vergleichen". Ich sage, es wird keinen signifikanten Unterschied geben. Wenn Sie es testen möchten, fahren Sie fort.
Neugierig
3
Genau; kein signifikanter Unterschied. Ich benutze diesen Ansatz, um posteriore prädiktive Verteilungen zu konstruieren. Geben Sie einfach die Vorhersagewerte der Variablen auf der rechten Seite zusammen mit den früheren Werten und die NAs für die Zielvariablen "Beobachtungen" ein, die den Vorhersagewerten entsprechen.
Jbowman
@jbowman, ja, gute Nachricht! Keine naheliegende Idee, Vorhersagen auf diese Weise zu treffen!
Neugierig