Angenommen , Sie haben einen einzigen Querschnitt von Daten , bei denen Personen befinden sich innerhalb von Gruppen (zB Studenten in Schulen) , und Sie mögen ein Modell der Form abzuschätzen , Y_i = a + B*X_i
wo X
ein Vektor der individuellen Ebene Eigenschaften und a
eine Konstante.
Nehmen Sie in diesem Fall an, dass die unbeobachtete Heterogenität zwischen den Gruppen Ihre Punktschätzungen B
und deren SEs beeinflusst, da sie mit Ihrer unabhängigen interessierenden Variablen korreliert.
Eine Möglichkeit besteht darin, Ihre SEs nach Gruppen (Schulen) zu gruppieren. Eine andere Möglichkeit besteht darin, Gruppen-FEs einzuschließen. Eine andere ist, beide zu verwenden. Was ist bei der Auswahl zwischen diesen Optionen zu beachten? Es ist besonders unklar, warum man SEs nach Gruppe gruppieren UND Gruppe FE verwenden könnte. In meinem speziellen Fall habe ich 35 Gruppen und 5.000 Personen, die in jeder Gruppe verschachtelt sind . Ich habe die Diskussion in diesem PDF verfolgt , aber es ist nicht ganz klar, warum und wann man sowohl Clustered SEs als auch Fixed Effects verwenden könnte.
(Bitte besprechen Sie die Vor- und Nachteile von SEs in Clustern im Vergleich zu FEs, anstatt vorzuschlagen, dass ich nur ein Mehrebenenmodell einsetze.)
quelle
Behobene Effekte dienen dazu, unbeobachtete Heterogenitäten ZWISCHEN verschiedenen Gruppen in Ihren Daten zu beseitigen.
Ich bin mit der Annahme nicht einverstanden, dass die Entscheidung für ein FE-Modell davon abhängt, ob Sie "weniger Variationen" verwenden möchten oder nicht. Wenn Ihre abhängige Variable von nicht beobachtbaren Variablen betroffen ist, die systematisch zwischen Gruppen in Ihrem Panel variieren, wird der Koeffizient für jede Variable, die mit dieser Variation korreliert ist, verzerrt. Sofern Ihre X-Variablen nicht zufällig zugewiesen wurden (und es niemals Beobachtungsdaten geben werden), ist es in der Regel recht einfach, das Argument für die ausgelassene Variablen-Verzerrung zu verwenden. Du darfstEinige der ausgelassenen Variablen können mit einer guten Liste von Kontrollvariablen kontrolliert werden. Wenn jedoch eine eindeutige Identifikation Ihr wichtigstes Ziel ist, kann sogar eine umfangreiche Liste von Kontrollen den kritischen Lesern Raum lassen, an Ihren Ergebnissen zu zweifeln. In diesen Fällen ist es normalerweise eine gute Idee, ein Modell mit festen Effekten zu verwenden.
Clustered-Standardfehler sind für die Berücksichtigung von Situationen gedacht, in denen Beobachtungen INNERHALB jeder Gruppe nicht erfasst werden (unabhängig und identisch verteilt).
Ein klassisches Beispiel ist, wenn Sie im Laufe der Zeit viele Beobachtungen für eine Gruppe von Unternehmen gemacht haben. Sie können feste Effekte auf Unternehmensebene berücksichtigen, es kann jedoch dennoch zu unerklärlichen Abweichungen in Ihrer abhängigen Variablen kommen, die über die Zeit hinweg korrelieren. Im Allgemeinen ist es bei der Arbeit mit Zeitreihendaten normalerweise sicher, eine zeitliche serielle Korrelation in den Fehlerbegriffen innerhalb Ihrer Gruppen anzunehmen. Diese Situationen sind die offensichtlichsten Anwendungsfälle für gruppierte SEs.
Einige anschauliche Beispiele:
Wenn Sie experimentelle Daten haben, bei denen Sie Behandlungen nach dem Zufallsprinzip zuweisen, aber für jede Person / Gruppe im Laufe der Zeit wiederholte Beobachtungen machen, ist es gerechtfertigt, feste Effekte auszulassen, aber Sie möchten Ihre SEs gruppieren.
Alternativ können Sie, wenn Sie viele Beobachtungen pro Gruppe für nicht experimentelle Daten haben, jede Beobachtung innerhalb der Gruppe als Iid-Draw aus ihrer größeren Gruppe betrachten (z. B. haben Sie Beobachtungen von vielen Schulen, aber jede Gruppe ist eine zufällig gezogene Teilmenge von Schülern ihrer Schule) möchten Sie feste Effekte einbeziehen, benötigen jedoch keine gruppierten SEs.
quelle
Diese Antworten sind in Ordnung, aber die aktuellste und beste Antwort liefern Abadie et al. (2019) "Wann sollten Sie Standardfehler für das Clustering anpassen?" Ein Hauptgrund für Cluster mit festen Effekten ist die Heterogenität der Behandlungseffekte in den Clustern. Es gibt andere Gründe, zum Beispiel, wenn die Cluster (z. B. Unternehmen, Länder) eine Teilmenge der Cluster in der Bevölkerung sind (auf die Sie schließen). Clustering ist ein Designproblem, das die Hauptbotschaft des Papiers ist. Mach es nicht blind.
quelle