Unterschied in Unterschieden zu einzelnen Level-Panel-Daten

Was ist der richtige Weg, um einen Unterschied im Differenzmodell mit individuellen Level-Panel-Daten anzugeben?

Hier ist das Setup: Angenommen, ich habe Panel-Daten auf Einzelebene, die seit mehreren Jahren in Städten eingebettet sind, und die Behandlung variiert je nach Stadtjahr. Formal lassen das Ergebnis für einzelne sein in der Stadt und Jahr und eine Attrappe sein , ob die Intervention betroffenen Stadt in Jahr . Ein typischer DiD-Schätzer wie der von Bertrand et al. (2004, S. 250) beschriebene basiert auf einem einfachen OLS-Modell mit festen Effektbedingungen für Stadt und Jahr: $y_{ist}$ $i$ $s$ $t$ $D_{st}$ $s$ $t$

y_{ich s t} = {EIN}_{s} + {B.}_{t} + c {X.}_{ich s t} + β {D.}_{s t} + ϵ_{ich s t}

$y_{ist} = A_{s} + B_t + cX_{ist} + \beta D_{st} + \epsilon_{ist}$

Aber ignoriert dieser Schätzer die Panelstruktur auf Einzelebene (dh mehrere Beobachtungen für jedes Individuum innerhalb der Städte)? Ist es sinnvoll, dieses Modell um einen festen Effektterm individueller Ebene zu erweitern ? Viele DiD-Anwendungen verwenden wiederholte Querschnittsdaten ohne die Panel-Daten auf Einzelebene. $S_i$

Bertrand, Marianne, Esther Duflo und Sendhil Mullainathan. 2004. „Wie sehr sollten wir Differenzen-in-Differenzen-Schätzungen vertrauen?“ Quarterly Journal of Economics 119 (1): 249–75.

econometrics panel-data fixed-effects-model difference-in-difference greg
quelle

Wenn Sie die Effekte der Entitätsattrappen erfassen möchten, können Sie ein Modell mit festen Effekten erstellen. DID entspricht FE mit 2 Zeiträumen. Wenn Sie also Dummies einbeziehen und dann DID ausführen, fallen diese aus.

VCG

Korrigieren Sie mich, wenn ich falsch liege, aber ich sehe zwei Unterschiede: a) Ein zB Modell würde einen Vergleich innerhalb einer Einheit verwenden, um den Effekt abzuschätzen (z. B. Ist das Einkommen nach einem bestimmten Lebensereignis höher oder niedriger). Die Idee eines DiD-Ansatzes besteht darin, andere Beobachtungen als Kontrolltrend zu verwenden, um zu erfassen, was ohne die Behandlung geschehen wäre. b) DiD konzentriert sich auf eine Behandlung auf Gruppenebene und nicht auf eine Behandlung auf Einzelebene. Die Frage ist nun, was passiert, wenn ich der Gleichung in meinem Beispiel nur einen einzelnen Level-zB-Term hinzufüge. Verwendet das die Kontrollbeobachtung als Kontrolltrend? Alle Kontrollbeobachtungen variieren jedoch nicht in Bezug auf die Behandlung ...

Greg

Antworten:

Ein nettes Merkmal von Difference-in-Differences (DiD) ist, dass Sie keine Paneldaten dafür benötigen. Da die Behandlung auf einer bestimmten Aggregationsebene erfolgt (in Ihren Fallstädten), müssen Sie vor und nach der Behandlung nur zufällige Personen aus den Städten befragen. Dies ermöglicht es Ihnen, zu schätzen

y_{ich s t} = {EIN}_{G} + {B.}_{t} + β {D.}_{s t} + c {X.}_{ich s t} + ϵ_{ich s t}

$y_{ist} = A_g + B_t + \beta D_{st} + c X_{ist} + \epsilon_{ist}$ und erhalten Sie den kausalen Effekt der Behandlung als den erwarteten Unterschied nach dem Ergebnis für die behandelte Person abzüglich des erwarteten Unterschieds nach dem Ergebnis für die Kontrolle.

y_{ich t} = α_{ich} + {B.}_{t} + β {D.}_{ich t} + c {X.}_{ich t} + ϵ_{ich t}

$y_{it} = \alpha_i + B_t + \beta D_{it} + cX_{it}+\epsilon_{it}$

D_{i t}

$D_{it}$ von Steve Pischke.

$A_g$

Hier ist ein Codebeispiel, das zeigt, dass dies der Fall ist. Ich verwende Stata, aber Sie können dies im Statistikpaket Ihrer Wahl replizieren. Die "Individuen" hier sind eigentlich Länder, aber sie sind immer noch nach einem Behandlungsindikator gruppiert.

* load the data set (requires an internet connection)
use "http://dss.princeton.edu/training/Panel101.dta"

* generate the time and treatment group indicators and their interaction
gen time = (year>=1994) & !missing(year)
gen treated = (country>4) & !missing(country)
gen did = time*treated

* do the standard DiD regression
reg y_bin time treated did

------------------------------------------------------------------------------
       y_bin |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
        time |       .375   .1212795     3.09   0.003     .1328576    .6171424
     treated |   .4166667   .1434998     2.90   0.005       .13016    .7031734
         did |  -.4027778   .1852575    -2.17   0.033    -.7726563   -.0328992
       _cons |         .5   .0939427     5.32   0.000     .3124373    .6875627
------------------------------------------------------------------------------

 * now repeat the same regression but also including country fixed effects
 areg y_bin did time treated, a(country)

------------------------------------------------------------------------------
       y_bin |      Coef.   Std. Err.      t    P>|t|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
        time |       .375    .120084     3.12   0.003     .1348773    .6151227
     treated |          0  (omitted)
         did |  -.4027778   .1834313    -2.20   0.032    -.7695713   -.0359843
       _cons |   .6785714    .070314     9.65   0.000       .53797    .8191729
-------------+----------------------------------------------------------------

Sie sehen also, dass der DiD-Koeffizient gleich bleibt, wenn die einzelnen festen Effekte enthalten sind ( aregist einer der verfügbaren Schätzbefehle für feste Effekte in Stata). Die Standardfehler sind etwas enger und unser ursprünglicher Behandlungsindikator wurde von den einzelnen festen Effekten absorbiert und fiel daher in die Regression.

Als Antwort auf den Kommentar
erwähnte ich das Pischke-Beispiel, um zu zeigen, wann Menschen einzelne feste Effekte anstelle eines Behandlungsgruppenindikators verwenden. Ihre Einstellung hat eine genau definierte Gruppenstruktur, sodass die Art und Weise, wie Sie Ihr Modell geschrieben haben, vollkommen in Ordnung ist. Standardfehler sollten auf Stadtebene gruppiert werden, dh auf der Aggregationsebene, auf der die Behandlung erfolgt (ich habe dies im Beispielcode nicht getan, aber in den DiD-Einstellungen müssen die Standardfehler korrigiert werden, wie in der Veröffentlichung von Bertrand et al. Gezeigt ).

$D_{st}$ $s$ $t$

c = [E. (y_{ich s t} | s = 1, t = 1) - - E. (y_{ich s t} | s = 1, t = 0)]] - - [E. (y_{ich s t} | s = 0, t = 1) - - E. (y_{ich s t} | s = 0, t = 0)]]

$c = \left[ E(y_{ist}|s=1,t=1) - E(y_{ist}|s=1,t=0)\right] - \left[ E(y_{ist}|s=0,t=1) - E(y_{ist}|s=0,t=0)\right]$

$E(y_{ist}|s=1,t=1)$ $E(y_{ist}|s=0,t=1)$ . Um zu verdeutlichen, warum die Identifizierung von den Gruppenunterschieden im Zeitverlauf und nicht von den Bewegern herrührt, können Sie dies mit einem einfachen Diagramm visualisieren. Angenommen, die Änderung des Ergebnisses ist wirklich nur auf die Behandlung zurückzuführen und hat eine gleichzeitige Wirkung. Wenn wir eine Person haben, die nach Beginn der Behandlung in einer behandelten Stadt lebt und dann in eine Kontrollstadt zieht, sollte ihr Ergebnis auf das zurückgehen, was es vor der Behandlung war. Dies ist in der folgenden stilisierten Grafik dargestellt.

Vielleicht möchten Sie aus anderen Gründen immer noch an Mover denken. Zum Beispiel, wenn die Behandlung eine dauerhafte Wirkung hat (dh sie beeinflusst immer noch das Ergebnis, obwohl sich die Person bewegt hat)

Andy
quelle

Gute Antwort. Würden Sie hier auch empfehlen, die Fehler auf Stadtebene zu gruppieren?

Dimitriy V. Masterov

Tolle Antwort, danke. Ihre Gleichung ist Gleichung 3 von Seite 12, richtig? Pischke führt diesen Teil mit "Manchmal gibt es jedoch keine natürlichen Einheiten, in denen die Behandlung zugewiesen wird. Stattdessen werden einige Personen zu einem bestimmten Zeitpunkt behandelt, andere nicht". Das ist aber nicht wirklich der Fall. Die Behandlung ist auf der Ebene der Stadt (oder einer anderen Gruppe) in meiner Einstellung + Ich habe Paneldaten. Es könnte immer noch das richtige Modell sein, vielleicht mit Clustered Se. Was würden Sie sagen? Was ist, wenn sich Einzelpersonen über Jahre hinweg zwischen Städten bewegen können? In diesem Fall würde der Coef für "behandelt" anhand der Mover identifiziert, oder?

Greg

@ DimitriyV.Masterov Die Empfehlung von Bertrand et al. Wäre, die Standardfehler auf Gruppenebene zu gruppieren, auf der die Behandlung stattfindet. Alternativ können Sie auch einen Block-Bootstrap mit Ersatz verwenden, der sich jedoch wieder auf Stadtebene befindet.

Andy

@greg Ich habe die Antwort bearbeitet, um auf Ihren Kommentar etwas detaillierter zu antworten. Ich hoffe das hilft :-)

Andy

Macht es einen Unterschied, wenn wir mehrere Perioden verwenden? Der Dummy D_i_t ist für alle Zeiträume vor dem Ereignis Null und für alle Zeiträume nach dem Ereignis sowieso Eins. Wäre es nicht dasselbe, wenn ich nur zwei Perioden verwenden würde? @ Andy

Jinhua Wang

Die kurze Antwort lautet, dass die Verwendung eines festen Effekts auf der Ebene der Einheit oder der behandelten Gruppe die Schätzung nicht ändert, sondern nur die Schlussfolgerung. In der Regel absorbiert die Verwendung eines Einheitseffekts mehr Variationen, und daher treten kleinere Standardfehler auf.

Ob sich die Einheiten in derselben aggregierten Gruppe befinden, ändert nichts an diesem Ergebnis (es ändert nur die Art und Weise, wie Sie Ihre behandelte Gruppenebene definieren , und die Tatsache, dass Sie anstelle wiederholter Querschnitte ein Bedienfeld benötigen).

Beachten Sie jedoch, dass die Äquivalenz nur gilt, wenn keine Kovariate X vorhanden ist. Sobald Sie X haben, sind die Ergebnisse unterschiedlich, unabhängig davon, ob Sie feste Effekte für Einheiten oder Gruppen verwenden.

Das folgende Beispiel vergleicht die 3 Schätzer in zwei Fällen mit und ohne X. Schätzer sind:

OLS
FE mit (behandelter) gruppenfester Wirkung
FE mit einheitlichem Effekt

#>              OLS         FE treated  FE unit   OLS x       FE treated x  FE unit x
#> ----------------------------------------------------------------------------------
#> (Intercept)   0.500 ***                         0.491 ***                         
#>              (0.094)                           (0.107)                            
#> did          -0.403 *    -0.403 *    -0.403 *  -0.407 *    -0.407 *      -0.460 * 
#>              (0.185)     (0.185)     (0.183)   (0.189)     (0.189)       (0.187)  
#> x1                                              0.018       0.018         0.220   
#>                                                (0.104)     (0.104)       (0.165)  
#> ----------------------------------------------------------------------------------
#> Num. obs.    70          70          70        70          70            70       
#> ==================================================================================
#> *** p < 0.001, ** p < 0.01, * p < 0.05

Code:

library(tidyverse)
library(haven)
library(texreg)
library(lfe)


dat <- read_dta("http://dss.princeton.edu/training/Panel101.dta")  %>% 
  mutate(time = (year>=1994) ,
         treated = (country>4),
         did = time*treated)

reg_ols <- lm(y_bin~ time+ treated+ did, data = dat)
reg_fe_a <- felm(y_bin~ did | time+ treated, data = dat)
reg_fe_b <- felm(y_bin~ did | time+ country, data = dat)

reg_ols_x <- update(reg_ols, .~.+x1)
reg_fe_a_x <- update(reg_fe_a, .~.+x1)
reg_fe_b_x <- update(reg_fe_b, .~.+x1)



screenreg(list(reg_ols, reg_fe_a, reg_fe_b, reg_ols_x, reg_fe_a_x, reg_fe_b_x), 
          omit.coef = "time|treated", digits=3, 
          include.rsquared = FALSE, include.adjrs = FALSE, include.rmse = FALSE,
          custom.model.names = c("OLS", "FE treated", "FE unit", "OLS x", "FE treated x", "FE unit x"))

Matifou
quelle