Müssen Nullzählungen für einen Likelihood-Ratio-Test von Poisson / Loglinear-Modellen angepasst werden?

9

Wenn die Kontingenztabelle Nullen enthält und wir verschachtelte Poisson / Loglinear-Modelle (unter Verwendung der R- glmFunktion) für einen Likelihood-Ratio-Test anpassen, müssen wir die Daten vor dem Anpassen der glm-Modelle anpassen (z. B. 1/2 zu allen hinzufügen) die zählt)? Natürlich können einige Parameter nicht ohne Anpassung geschätzt werden, aber wie wirkt sich die Anpassung / fehlende Anpassung auf den LR-Test aus?

BR1
quelle
vermutlich würde die glmRoutine knacken, wenn sie nicht mit Nullen umgehen könnte. Hast du es versucht?
Shabbychef
1
Ja, es stürzt nicht ab, aber abhängig von der Formel (z. B. in einem gesättigten Modell) können einige der Parameter effektiv unendlich viele Standardfehler aufweisen. Meine Frage ist, ob dies ein Problem ist, wenn ein Likelihood-Ratio-Test durchgeführt wird. Sie können eine Wahrscheinlichkeit auch dann berechnen, wenn einige Parameter nicht geschätzt werden. Diese Parameter tragen jedoch nicht zur Wahrscheinlichkeit bei. Was ist die Standardpraxis und warum?
BR1

Antworten:

7

Eine der Möglichkeiten der Regressionsmodellierung besteht im Allgemeinen darin, Bereiche ohne Daten zu glätten. Wie Sie jedoch bemerkt haben, treten gelegentlich Probleme bei der Schätzung von Parametern auf. Ich würde vorschlagen, dass es an der Zeit ist, Ihren Modellierungsansatz ein wenig zu überdenken, wenn Sie Dinge wie unendliche Standardfehler erhalten.

Ein besonderer Hinweis zur Vorsicht: Es gibt einen Unterschied zwischen "Keine Zählung" in einer bestimmten Schicht und es ist unmöglich, dass es in dieser Schicht Zählungen gibt . Stellen Sie sich zum Beispiel vor, Sie arbeiten zwischen 2000 und 2009 an einer Studie über psychische Störungen für die US-Marine und haben binäre Regressionsbegriffe für "Is a Woman" und "Serves on a Submarine". Ein Regressionsmodell kann möglicherweise Effekte abschätzen, bei denen beide Variablen = 1 sind, obwohl es eine Nullzahl gibt, bei der beide = 1. Diese Schlussfolgerung wäre jedoch nicht gültig - ein solcher Umstand ist unmöglich. Dieses Problem wird als "Nicht-Positivität" bezeichnet und ist gelegentlich ein Problem in stark geschichteten Modellen.

Fomite
quelle
@ skyguy94 Seltsamerweise nicht - ich wusste das, ich hatte gerade vergessen, die Verwendung eines retrospektiven Datensatzes zu beachten>. <. Bearbeitet, um das widerzuspiegeln.
Fomite
Betreff: "Ein Regressionsmodell kann möglicherweise Effekte abschätzen, bei denen beide Variablen = 1 sind, oder Wechselwirkungen zwischen beiden " - ich glaube nicht, dass dies wahr ist. Wenn Sie zwei binäre Prädiktoren haben, die niemals '1' zusammen sind, ist die Interaktion konstant (sie ist immer '0'), sodass ihre Wirkung nicht identifiziert wird.
Makro
@ Macro Du hast recht, ich bearbeite leicht. Ich habe nach Begriffen gesucht, bei denen es sich nicht um binäre Indikatoren handelt.
Fomite
1
(+1) Bei Problemen mit der Nichtplausibilität des Falls, in dem beide = 1 sind, wäre die modellbasierte Schätzung nur die Summe der beiden Randeffekte, von denen wir wissen, dass sie für sich genommen sehr irreführend sein können :)
Makro