Was ist der richtige Weg, um einen Unterschied im Differenzmodell mit individuellen Level-Panel-Daten anzugeben?
Hier ist das Setup: Angenommen, ich habe Panel-Daten auf Einzelebene, die seit mehreren Jahren in Städten eingebettet sind, und die Behandlung variiert je nach Stadtjahr. Formal lassen das Ergebnis für einzelne sein i in der Stadt s und Jahr t und D s t eine Attrappe sein , ob die Intervention betroffenen Stadt s in Jahr t . Ein typischer DiD-Schätzer wie der von Bertrand et al. (2004, S. 250) beschriebene basiert auf einem einfachen OLS-Modell mit festen Effektbedingungen für Stadt und Jahr:
Aber ignoriert dieser Schätzer die Panelstruktur auf Einzelebene (dh mehrere Beobachtungen für jedes Individuum innerhalb der Städte)? Ist es sinnvoll, dieses Modell um einen festen Effektterm individueller Ebene zu erweitern ? Viele DiD-Anwendungen verwenden wiederholte Querschnittsdaten ohne die Panel-Daten auf Einzelebene.
Bertrand, Marianne, Esther Duflo und Sendhil Mullainathan. 2004. „Wie sehr sollten wir Differenzen-in-Differenzen-Schätzungen vertrauen?“ Quarterly Journal of Economics 119 (1): 249–75.
Antworten:
Ein nettes Merkmal von Difference-in-Differences (DiD) ist, dass Sie keine Paneldaten dafür benötigen. Da die Behandlung auf einer bestimmten Aggregationsebene erfolgt (in Ihren Fallstädten), müssen Sie vor und nach der Behandlung nur zufällige Personen aus den Städten befragen. Dies ermöglicht es Ihnen, y i s t = A g + B t + β D s t + c X i s t + ϵ i s t zu schätzen
Hier ist ein Codebeispiel, das zeigt, dass dies der Fall ist. Ich verwende Stata, aber Sie können dies im Statistikpaket Ihrer Wahl replizieren. Die "Individuen" hier sind eigentlich Länder, aber sie sind immer noch nach einem Behandlungsindikator gruppiert.
Sie sehen also, dass der DiD-Koeffizient gleich bleibt, wenn die einzelnen festen Effekte enthalten sind (
areg
ist einer der verfügbaren Schätzbefehle für feste Effekte in Stata). Die Standardfehler sind etwas enger und unser ursprünglicher Behandlungsindikator wurde von den einzelnen festen Effekten absorbiert und fiel daher in die Regression.Als Antwort auf den Kommentar
erwähnte ich das Pischke-Beispiel, um zu zeigen, wann Menschen einzelne feste Effekte anstelle eines Behandlungsgruppenindikators verwenden. Ihre Einstellung hat eine genau definierte Gruppenstruktur, sodass die Art und Weise, wie Sie Ihr Modell geschrieben haben, vollkommen in Ordnung ist. Standardfehler sollten auf Stadtebene gruppiert werden, dh auf der Aggregationsebene, auf der die Behandlung erfolgt (ich habe dies im Beispielcode nicht getan, aber in den DiD-Einstellungen müssen die Standardfehler korrigiert werden, wie in der Veröffentlichung von Bertrand et al. Gezeigt ).
Vielleicht möchten Sie aus anderen Gründen immer noch an Mover denken. Zum Beispiel, wenn die Behandlung eine dauerhafte Wirkung hat (dh sie beeinflusst immer noch das Ergebnis, obwohl sich die Person bewegt hat)
quelle
Die kurze Antwort lautet, dass die Verwendung eines festen Effekts auf der Ebene der Einheit oder der behandelten Gruppe die Schätzung nicht ändert, sondern nur die Schlussfolgerung. In der Regel absorbiert die Verwendung eines Einheitseffekts mehr Variationen, und daher treten kleinere Standardfehler auf.
Ob sich die Einheiten in derselben aggregierten Gruppe befinden, ändert nichts an diesem Ergebnis (es ändert nur die Art und Weise, wie Sie Ihre behandelte Gruppenebene definieren , und die Tatsache, dass Sie anstelle wiederholter Querschnitte ein Bedienfeld benötigen).
Beachten Sie jedoch, dass die Äquivalenz nur gilt, wenn keine Kovariate X vorhanden ist. Sobald Sie X haben, sind die Ergebnisse unterschiedlich, unabhängig davon, ob Sie feste Effekte für Einheiten oder Gruppen verwenden.
Das folgende Beispiel vergleicht die 3 Schätzer in zwei Fällen mit und ohne X. Schätzer sind:
Code:
quelle