Ich habe einen longitudinalen Datensatz von Personen und einige von ihnen wurden einer Behandlung unterzogen und andere nicht. Alle Personen sind von der Geburt bis zum 18. Lebensjahr in der Stichprobe und die Behandlung erfolgt in einem Alter zwischen diesem Bereich. Das Alter der Behandlung kann von Fall zu Fall unterschiedlich sein. Mit dem Propensity-Score-Matching möchte ich behandelte und kontrollierte Einheiten paarweise mit genauem Matching zum Geburtsjahr abgleichen, sodass ich jedes Paar von ihrem Geburtsjahr bis zum 18. Lebensjahr nachverfolgen kann. Insgesamt gibt es etwa 150 behandelte und 4000 unbehandelte Personen. Nach dem Matching besteht die Idee darin, eine Differenz-in-Differenz-Strategie zu verwenden, um den Effekt der Behandlung abzuschätzen.
Das Problem, mit dem ich im Moment konfrontiert bin, ist das Matching mit Paneldaten. Ich verwende den psmatch2
Befehl von Stata und stimme mit dem Propensity Score Matching auf Haushalts- und individuelle Merkmale ab. Im Allgemeinen wird es bei Panel-Daten in jedem Alter unterschiedliche optimale Übereinstimmungen geben. Als Beispiel: Wenn A behandelt wird, sind B und C Kontrollen und alle wurden 1980 geboren, dann können A und B 1980 im Alter von 0 Jahren zugeordnet werden, während A und C 1981 im Alter von 1 Jahren usw. zugeordnet werden . Außerdem kann A mit seinen eigenen Vorbehandlungswerten aus früheren Jahren abgeglichen werden.
Um dieses Problem zu umgehen, habe ich den Durchschnitt aller zeitlich variierenden Variablen so ermittelt, dass durch das Matching Personen identifiziert werden können, die sich im Durchschnitt über die Dauer der Stichprobe am ähnlichsten sind, und ich führe das Matching für jede Altersgruppe von 0 bis 18 Jahren separat durch. Leider entspricht dies immer noch einer anderen Steuereinheit für jede behandelte Einheit pro Altersgruppe.
Wenn mich jemand auf eine Methode zum paarweisen Abgleich mit Paneldaten in Stata hinweisen könnte, wäre dies sehr dankbar.
Es gibt keine Möglichkeit, dies in Stata oder einer anderen mir bekannten Software zu tun .
Wenn Sie versuchen, einen voreingenommenen Matching Estimator mit Paneldatentechniken zu patchen, ist hier ein Ansatz, der möglicherweise funktioniert. Wenn Sie davon ausgehen können, dass der Abgleich einige, aber nicht alle Auswahlfehler berücksichtigt, der Fehler jedoch über die Zeit weitgehend konstant bleibt, können Sie den zeitinvarianten Teil des Fehlers entfernen, indem Sie separate Abgleichschätzungen für jeden Zeitraum und jede Periode erstellen der Unterschied.
Sei die Vorbehandlungsperiode und t ' die Nachbehandlung. Wenn der unbehandelte Zustand das Ergebnis Y 0 erfülltt t′ Y0
Heckman, Ichimura, Smith und Todd 1998 Econometrica und Eichler und Lechner 2002 Labour Economics Papers sind Beispiele für diesen Ansatz. Andererseits reichen 150 behandelte Beobachtungen möglicherweise nicht aus, damit dieser Ansatz funktioniert.
quelle
Schritte:
Wie von Greg ausführlich erwähnt, können Sie einen Querschnittsdatensatz entweder für Vorbehandlungsmittel oder für eine bestimmte Vorbehandlungsperiode verwenden, um das Matching zu generieren.
Über das gesamte Panel ordnen Sie Indikatorvariablen zu für
a. TreatedIndividual
b. TreatedPeriod, letzteres ist gleich Null, sobald die Behandlung für das TreatedIndividual erfolgt.
Da der Zeitpunkt, zu dem sich die behandelte Periode von 0 auf 1 ändert, von Person zu Person unterschiedlich ist und für unbehandelte Spiele niemals auf 1 wechselt, müssen Sie dem unbehandelten Spiel denselben Startpunkt vom behandelten Spiel zum unbehandelten Spiel zuweisen. Das ist intuitiv, aber ich würde mir immer noch eine gute Referenz wünschen, die diesen Ansatz rechtfertigt, den ich bisher nicht gefunden habe.
Der Regressionsaufbau wäre:
wo der Interaktionsbegriff Ihnen den Behandlungseffekt gibt.
quelle
Haben Sie darüber nachgedacht, den nnmatch zu verwenden ? Befehl ?
Ich benutze diesen Befehl und es ist ein ziemlich umfassender. Dabei werden verschiedene Matching-Algorithmen und auch Fälle berücksichtigt, in denen der Propensity Score für einige Kontrollgruppen-Individuen gleich ist. Natürlich hängt die Behandlung dieses Falls vom Matching-Algorithmus ab, ob Sie k-next-neighbour oder kernel oder was auch immer nehmen.
quelle