Angeben eines Unterschiedsmodells mit mehreren Zeiträumen

20

Wenn ich ein Differenzmodell mit zwei Zeiträumen schätze, wäre das äquivalente Regressionsmodell

ein. Y.ichst=α+γsTreeintment+λdt+δ(Treeintmentdt)+ϵichst

  • wobei die ein Dummy ist, der gleich 1 ist, wenn die Beobachtung von der Behandlungsgruppe stammtTreeintment
  • und ist ein Dummy, der in dem Zeitraum nach dem Auftreten der Behandlung gleich 1 istd

Somit nimmt die Gleichung die folgenden Werte an.

  • Kontrollgruppe vor der Behandlung:α
  • Kontrollgruppe nach Behandlung:α+λ
  • Behandlungsgruppe vor der Behandlung:α+γ
  • Behandlungsgruppe nach der Behandlung: α+γ+λ+δ

Daher ist in einem Zwei-Perioden-Modell die Differenz in der Differenzschätzung .δ

Aber was passiert in Bezug auf dt wenn ich mehr als eine Vor- und Nachbehandlungsperiode habe? Benutze ich immer noch einen Dummy, der anzeigt, ob ein Jahr vor oder nach der Behandlung liegt?

Oder füge ich stattdessen Jahresattrappen hinzu, ohne anzugeben, ob jedes Jahr zur Vor- oder Nachbehandlungsperiode gehört? So was:

b. Y.ichst=α+γsTreeintment+yeeinrdummy+δ(Treeintmentdt)+ϵichst

Oder kann ich beide einschließen (dh )?yeeinrdummy+λdt

c. Y.ichst=α+γsTreeintment+yeeinrdummy+λdt+δ(Treeintmentdt)+ϵichst

Wie kann ich abschließend ein Differenzmodell mit mehreren Zeiträumen (a, b oder c) angeben?

Tom
quelle
1
Sie verwenden in der Regel das Modell b. Beachten Sie, dass in Modell c perfekt mit den Jahresattrappen kollinear ist, sodass das Modell nicht geschätzt werden kann. dt
Standard_error
Es wäre großartig, wenn Sie erklären könnten, warum b allgemein verwendet wird. Geben Sie vielleicht einige Verweise oder nur eine Erklärung mit zwei Sätzen.
mpiktas
und im Modell b. Könnten Sie eine kontinuierliche Variable für das Jahr anstelle von Dummys hinzufügen? Wie würde sich die Interpretation der Koeffizienten in diesen Fällen unterscheiden?

Antworten:

19

Die typische Methode zum Schätzen eines Differenzmodells mit mehr als zwei Zeiträumen ist Ihre vorgeschlagene Lösung. B). Halten Ihre Notation Sie würde zurückbilden , wo D tBehandlung sd t ist ein Dummy - Variable ist, die gleich eins für Behandlungseinheiten s

Y.ichst=α+γs(Behandlungs)+λ(Jahr Dummyt)+δDst+ϵichst
DtBehandlungsdtsin der Nachbehandlungsperiode ( ) und ist sonst Null. Es ist zu beachten, dass dies eine allgemeinere Formulierung der Differenz in der Differenzregression ist, die unterschiedliche Zeitpunkte der Behandlung für unterschiedliche behandelte Einheiten ermöglicht.dt=1

γs0γs1s0s1t eine Einheit spezifischen Zeittrend γ s 1 t . Wenn Sie diese einheitsspezifischen Zeittrends und die Differenz der Differenzkoeffizienten δ einbeziehen

Y.ichst=γs0+γs1t+λ(Jahr Dummyt)+δDst+ϵichst
γs1tδ

Ein Beispiel aus Angrist und Pischke (2009) Mostly Harmless Econometrics ist eine arbeitsmarktpolitische Studie von Besley und Burgess (2004) . In ihrer Arbeit kommt es vor, dass die Einbeziehung zustandsspezifischer Zeittrends den geschätzten Behandlungseffekt zunichte macht. Beachten Sie jedoch, dass Sie für diese Robustheitsprüfung mehr als 3 Zeiträume benötigen.

Andy
quelle
Ein Follow-up, da ich zu entscheiden versuche, ob die Implementierung mit einigen Verwaltungsdaten angemessen ist: Würden Sie sagen, dass ein DD-Ansatz gültiger ist als ein CITS-Design, wenn ein Modell nur 4 Zeitpunkte (2 vor und 2 nach) enthält? Auch wenn ich mehrere Kohorten innerhalb von Datenwellen habe, sollten diese separat oder in einem einheitlichen Modell untersucht werden? Vielen Dank.
bfoste01
@Andy: Kannst du bitte erklären, was du mit s0, s1 und einheitenspezifischem Zeittrend meinst? Angenommen, ich habe zwei Zeitungen (WPT und NYT) und WPT ist meine Behandlungsgruppe. Welche davon wären s0 und s1?
user3683131
1
Bin ich zu Recht der Meinung, dass diese Analyse den Durchschnitt vor und nach der Behandlung vergleicht und keine säkularen Trends berücksichtigt? dh wenn d_t = 0 für alle Zeiträume vor dem Schaltpunkt und d_t = 1 für alle Zeiträume danach ist, dann ist diese Analyse im Wesentlichen dieselbe wie die beiden Zeiträume eins, außer dass der Durchschnitt aller Vorher / Nachher-Zeiträume gebildet wird Perioden. Werden Zeittrends im Ergebnis vor / nach dem Behandlungswechsel ignoriert? Ich versuche zu entscheiden, ob ein DiD-Modell für eine Analyse geeignet ist, die ich durchführen möchte.
11.
0

Ich möchte etwas klarstellen (und indirekt eine Frage in den Kommentaren ansprechen). Insbesondere geht es um die Verwendung von einheitsspezifischen linearen Zeittrends. Zur Überprüfung der Robustheit scheinen Sie nur Dummies für behandelte Einheiten (dh interagierenγ1s ) mit einem kontinuierlichen . Es ist jedoch tatsächlich so, dass Sie einen vollständigen Satz von Einheiten- / Status-Dummies (feste Einheiten- / Status-Effekte) mit einer linearen Zeittrendvariablen interagieren.

Angrist und Pischke (2009) empfehlen diesen Ansatz auf Seite 238 in Mostly Harmless Econometrics . Unterschiede in der Notation können Verwirrung stiften. Wiedergabe der Spezifikation 5.2.7:

yichst=γ0s+γ1st+λt+δDst+Xichstβ+εichst,

γ0ssγ1st

ys,t=sSteintes+tY.eeinrt+sSteintesTichmet+δDs,t+εs,t,

Ds,tstTichmet

Einheitenspezifische lineare Zeittrends werden auch in einem anderen Beitrag behandelt (siehe unten):

Wie kann die endogene Programmplatzierung berücksichtigt werden?

Zusammenfassend möchten Sie alle Einheiten- (Gruppen-) Dummys mit einer kontinuierlichen Zeittrendvariablen interagieren.

Artikel von Justin Wolfers ist unten als Referenz:

https://users.nber.org/~jwolfers/papers/Divorce(AER).pdf

Tom
quelle