Literatur zur IV-Quantil-Regression

16

In den letzten Monaten habe ich mich intensiv mit der quantilen Regression in Vorbereitung auf meine Masterarbeit in diesem Sommer beschäftigt. Insbesondere habe ich den größten Teil von Roger Koenkers 2005er Buch zu diesem Thema gelesen. Jetzt möchte ich dieses vorhandene Wissen auf Quantilregressionstechniken erweitern, die instrumentelle Variablen (IV) berücksichtigen. Dies scheint ein aktives Forschungsfeld zu sein, das rasant wächst.

Kann mir vielleicht jemand vorschlagen:

Artikel oder andere Literatur zur IV-Quantil-Regression
Ein kurzer Überblick über diese verschiedenen statistischen Techniken
die Vor- und Nachteile verschiedener Techniken

Ich suche hauptsächlich nach Literatur, um mich zu verbessern und einen guten Überblick über das zu bekommen, was da draußen ist. Der erste Punkt ist also der wichtige. Der zweite und dritte wäre schön zu haben! Auch mein Interesse liegt hauptsächlich auf den Querschnittsmethoden, aber auch Panel-Methoden sind willkommen.

Danke im Voraus.

regression references econometrics instrumental-variables quantile-regression AlexH
quelle

12

Ich würde einen Blick auf die 7 Papiere von Chernozhukov und Hansen IVQR werfen. Die Arbeit von 2005 wird oft zitiert. Sie bieten auch Links zu Daten und Code in MATLAB, OX und Stata.

Eine weitere häufig zitierte Veröffentlichung in dieser Literatur ist Abadie, Angrist und Imbens (2002) .

Frolich und Melly (2010) und Kwak (2010) sind ebenfalls einen Blick wert, besonders wenn Sie Stata verwenden. Beide bieten Code.

Dimitriy V. Masterov
quelle

24

Auch wenn diese Frage bereits eine akzeptierte Antwort hat, denke ich, dass ich trotzdem dazu beitragen kann. Das Buch von Koenker (2005) wird Sie wirklich nicht weit bringen, da die Entwicklungen in der IV-Quantil-Regression zu dieser Zeit zu beschleunigen begannen.

Zu den frühen IV-Quantil-Regressionstechniken gehört das Kausalketten-Framework von Chesher (2003) , das im Weighted Average Deviations-Ansatz (WAD) von Ma und Koenker (2006) weiterentwickelt wurde . In diesem Artikel stellen sie auch den Control-Variate-Ansatz vor. Eine ähnliche Idee wurde von Lee (2007) verwendet, der mithilfe von Kontrollfunktionen einen IV-Quantil-Regressionsschätzer ableitete.
Alle diese Schätzer verwenden eine angenommene dreieckige Fehlerstruktur, die zur Identifizierung notwendig ist. Das Problem dabei ist, dass diese Dreiecksstruktur für Endogenitätsprobleme, die aufgrund der Gleichzeitigkeit auftreten, nicht plausibel ist. Sie können diese Schätzer beispielsweise nicht für ein Problem der Angebots- / Bedarfsschätzung verwenden.

Der von Dimitriy V. Masterov erwähnte Schätzer von Abadie, Angrist und Imbens (2002) geht davon aus, dass Sie sowohl eine binäre endogene Variable als auch ein binäres Instrument haben. Im Allgemeinen ist dies ein sehr restriktiver Rahmen, aber er erweitert den LATE-Ansatz von der linearen Regression IV auf Quantilregressionen. Das ist schön, weil viele Forscher, insbesondere aus der Wirtschaft, mit dem LATE-Konzept und der Interpretation der resultierenden Koeffizienten vertraut sind.

Die wegweisende Arbeit von Chernozhukov und Hansen (2005) hat diese Literatur wirklich in Gang gebracht, und diese beiden Typen haben auf diesem Gebiet viel Arbeit geleistet. Der IV-Quantil-Regressionsschätzer (IVQR) bietet eine natürliche Verbindung zum 2SLS-Schätzer im Quantilkontext. Ihr Schätzer wird über Matlab oder Ox implementiert, wie Dimitriy betont hat, aber Sie können dieses Kwak-Papier (2010) vergessen. Dieses Papier hat es nie in das Stata-Journal geschafft und auch sein Code läuft nicht richtig. Ich nehme an, er hat dieses Projekt aufgegeben.
Stattdessen sollten Sie den Schätzer für die geglätteten Schätzgleichungen IVQR (SEE-IVQR) von berücksichtigen Kaplan und Sun (2012). Dies ist ein neuerer Schätzer, der eine Verbesserung gegenüber dem ursprünglichen IVQR-Schätzer in Bezug auf die Rechengeschwindigkeit (er vermeidet den lästigen Gittersuchalgorithmus) und den mittleren quadratischen Fehler darstellt. Der Matlab-Code ist verfügbarhier .

Die Arbeit von Frölich und Melly (2010) ist schön, weil sie den Unterschied zwischen bedingter und bedingungsloser Quantilregression berücksichtigt. Das Problem mit der quantilen Regression im Allgemeinen ist, dass sich die Interpretation ändert, sobald Sie Kovariaten in Ihre Regression einbeziehen. In OLS können Sie immer von der bedingten zur unbedingten Erwartung über das Gesetz der iterierten Erwartungen wechseln, aber für Quantile ist dies nicht verfügbar. Dieses Problem wurde erstmals von Firpo gezeigt (2007) und Firpo et al. (2009). Er verwendet eine rezentrierte Einflussfunktion, um bedingte Quantilregressionskoeffizienten so zu marginalisieren, dass sie als die üblichen OLS-Koeffizienten interpretiert werden können. Für Ihre Zwecke hilft dieser Schätzer nicht viel, da er nur exogene Variablen berücksichtigt. Bei Interesse stellt Nicole Fortin den Stata-Code auf ihrer Website zur Verfügung.

Der letzte mir bekannte bedingungslose IV-Quantil-Regressionsschätzer stammt von Powell (2013) . Mit seinem verallgemeinerten (IV) Quantil-Regressionsschätzer können Sie marginale Quantil-Behandlungseffekte bei Vorhandensein von Endogenität abschätzen. Irgendwo auf der RAND-Website stellt er auch seinen Stata-Code zur Verfügung, den ich aber gerade nicht gefunden habe. Da Sie danach gefragt haben: In einem früheren Artikel hatte er diesen Schätzer im Kontext der Paneldaten implementiert (siehe Powell, 2012) ). Dieser Schätzer ist großartig, da dieser Schätzer im Gegensatz zu allen früheren QR-Methoden für Paneldaten nicht auf großen T-Asymptoten basiert (die Sie normalerweise nicht haben, zumindest nicht in mikroökonometrischen Daten).

Last but not least eine exotischere Variante: der zensierte IVQR-Schätzer (CQIV) von Chernozhukov et al. (2011) erlaubt es, auf zensierte Daten zu achten - wie der Name schon sagt. Es ist eine Erweiterung des Papiers von Chernozhukov und Hong (2003), die ich nicht verknüpfe, weil es nicht für den IV-Kontext ist. Dieser Schätzer ist rechenintensiv, aber wenn Sie Daten zensiert haben und nicht anders herum, ist dies der richtige Weg. Amanda Kowalski hat den Stata-Code auf ihrer Website veröffentlicht oder Sie können ihn von herunterladen RePEc . Dieser Schätzer (und übrigens auch der IVQR und der SEE-IVQR) gehen davon aus, dass Sie eine kontinuierliche endogene Variable haben. Ich habe diese Schätzer im Zusammenhang mit Einkommensregressionen verwendet, bei denen Bildung meine endogene Variable war, die zwischen 18 und 20 Werte annahm, also nicht genau kontinuierlich. Aber in Simulationsübungen konnte ich immer zeigen, dass dies kein Problem ist. Dies hängt jedoch wahrscheinlich von der jeweiligen Anwendung ab. Wenn Sie sich für diese Option entscheiden, überprüfen Sie sie noch einmal.

Andy
quelle

Das ist eine tolle Antwort!

Dimitriy V. Masterov

2

Kurzes, sehr egozentrisches Update: Das bereits erwähnte Kaplan and Sun (2012) wurde 2017 veröffentlicht; Links zu den veröffentlichten und akzeptierten Versionen (Open Access) sowie Links zu MATLAB und R-Code sind unter faculty.missouri.edu/~kaplandm zu finden jetzt) ... tatsächlich fand ich die sehr hilfreiche Rezension oben, als ich die Einführung überarbeitete.

David M Kaplan

2

Das neue Handbuch zur quantitativen Regression enthält zwei ausgezeichnete Kapitel zu diesen Themen:

"Instrumental Variable Quantile Regression" von Chernozhukov, Hansen und Wüthrich ( Entwurf auf der Website von Chris Hansen )
"Local Quantile Treatment Effects" von Melly und Wüthrich ( Entwurf auf der Website von Blaise Melly )

David M Kaplan
quelle

Literatur zur IV-Quantil-Regression

Antworten: