Ich verwende für Zähldaten ein Poisson - Regressionsmodell und frag mich , ob es Gründe gibt , nicht den robusten Standardfehler für die Parameterschätzungen zu benutzen? Ich bin besonders besorgt, da einige meiner Schätzungen ohne Robustheit nicht signifikant sind (z. B. p = 0,13), aber mit Robustheit signifikant sind (p <0,01).
In SAS ist dies unter Verwendung der wiederholten Anweisung in proc genmod
(z repeated subject=patid;
. B. ) verfügbar . Ich habe http://www.ats.ucla.edu/stat/sas/dae/poissonreg.htm als Beispiel verwendet, in dem ein Artikel von Cameron und Trivedi (2009) zur Unterstützung der Verwendung robuster Standardfehler zitiert wird.
Ich werde Analysen unter Verwendung modellbasierter und robuster Standardfehler unterscheiden, indem ich letztere als "GEEs" bezeichne, was tatsächlich eine austauschbare Definition ist. Neben Scortchis fantastischer Erklärung:
GEEs können in kleinen Proben, dh 10-50 Probanden, "voreingenommen" sein: (Lipsitz, Laird und Harrington, 1990; Emrich und Piedmonte, 1992; Sharples und Breslow, 1992; Lipsitz et al., 1994; Qu, Piedmonte und Williams, 1994; Gunsolley, Getchell und Chinchilli, 1995; Sherman und le Cessie, 1997.) Wenn ich sage, dass GEEs voreingenommen sind, meine ich, dass die Standardfehlerschätzung aufgrund kleiner oder null Zellzahlen entweder konservativ oder antikonservativ sein kann abhängig davon, welche angepassten Werte dieses Verhalten aufweisen und wie konsistent sie mit dem Gesamttrend des Regressionsmodells sind.
Wenn das parametrische Modell korrekt angegeben ist, erhalten Sie im Allgemeinen immer noch korrekte Standardfehlerschätzungen von den modellbasierten CIs, aber der Sinn der Verwendung von GEE besteht darin, dieses sehr große "Wenn" zu berücksichtigen. Mit GEEs kann der Statistiker lediglich ein Arbeitswahrscheinlichkeitsmodell für die Daten angeben, und die Parameter (anstatt im streng parametrischen Rahmen interpretiert zu werden) werden als eine Art "Sieb" betrachtet, das unabhängig von der zugrunde liegenden, unbekannten Datenerzeugung reproduzierbare Werte erzeugen kann Mechanismus. Dies ist das Herz und die Seele der semiparametrischen Analyse, für die ein GEE ein Beispiel ist.
GEEs behandeln auch nicht gemessene Kovariationsquellen in den Daten, selbst wenn eine unabhängige Korrelationsmatrix angegeben wird. Dies liegt an der Verwendung einer empirischen und nicht einer modellbasierten Kovarianzmatrix. Bei der Poisson-Modellierung könnten Sie beispielsweise an Fruchtbarkeitsraten von Lachs interessiert sein, der aus verschiedenen Strömen entnommen wurde. Die von weiblichen Fischen geernteten Eizellen haben möglicherweise eine zugrunde liegende Poisson-Verteilung, aber genetische Variationen, die aus gemeinsamer Erblichkeit und verfügbaren Ressourcen in bestimmten Strömen bestehen, können dazu führen, dass Fische in diesen Strömen ähnlicher sind als in anderen Strömen. Das GEE gibt korrekte Populationsstandard-Fehlerschätzungen an, solange die Stichprobenrate mit ihrem Bevölkerungsanteil übereinstimmt (oder auf andere Weise geschichtet ist).
quelle
Sie testen die Null der Äquidispersion. Es ist eine einfache zusätzliche OLS-Regression. Auf Seite 670 finden Sie eine Beschreibung von Cameron und Trivedi. Bei großer Überdispersion sind die Standardfehler sehr entleert, daher wäre ich sehr vorsichtig bei Ergebnissen, die bei Überdispersion von einem nicht robusten VCE abhängen. Bei Unterdispersion ist das Gegenteil der Fall, was sich wie das Szenario anhört, in dem Sie sich befinden.
quelle