Kausale Identifizierung und bestrafte Splines

8

Ich habe gerade eine Ablehnung von einem Wirtschaftsjournal erhalten. Als Gründe für die Ablehnung wurden angeführt:

Die Vorteile der Verwendung der semiparametrischen Methode werden im Vergleich zu alternativen einfacheren Techniken mit sauberer Identifizierung von Kausalzusammenhängen nicht klar herausgestellt

Es ist durchaus möglich, dass ich die Methodik einer Reihe von Ökonomen, die sich im Allgemeinen an OLS halten, besser hätte motivieren können. Aber habe ich gegen "saubere Identifikation" verstoßen? Bitte urteilen Sie selbst und lassen Sie mich wissen, was Sie denken:

Meine Hauptschätzungsgleichung lautet ist stetig, und sind binär. Ich kann zu Recht davon ausgehen, dass ist. Das heißt, der Koeffizient für ist unverzerrt, abhängig von Dummy-Variablen auf Einzelebene ("feste Effekte" in ökonometrischer Sprache). Wenn ich kontinuierliche Variable umfassen , ich suche einfach an Heterogenität in geschätzten Behandlungseffekte über Steigungen von . Also die durchschnittliche kausale Wirkung der Behandlung Z X T E [ ϵ | α , T ] = 0 T Z Z.

yit=αi+β1Tit+f(ZitZit×TitZit×Tit×Xt)+β2Xt+ϵit
ZXT
E[ϵ|α,T]=0
TZZTist ein Durchschnitt von für die verschiedenen Ebenen von , die ich beobachte.β^1+f^Z×TZ

Das Modell wird durch bestrafte quadratische Splines etimiert (zB: Ruppert et al. 2003). Insbesondere:

y=β0+Xβ+1p(Zp)γ+j=1#varsk=1#knotsjδjk((Zjκjk)p×(Zj>κjk))+ϵ

Dies wird gelöst durch

[β^γ^δ^]=(CC+λ2pD)1Cy

wobei die parametrischen Terme und die Knotenterme enthält und wo die Gratstrafe nur für die Knotenterme gilt und ausgewählt wird, um den AIC zu minimieren. (Ich kann der Methodik nicht voll gerecht werden - siehe Ruppert et al. Oder Simon Woods Lehrbuch über GAMs).λCλ

Natürlich verwende ich diese Semiparametrik, weil ich meinen Daten keine unbegründeten Funktionsformen auferlegen möchte. Dies würde ganz natürlich meine Schätzungen beeinflussen, ebenso wie das Auferlegen einer logarithmischen Anpassung auf eine Sinusfunktion meine Schätzungen beeinflussen würde. Aber gibt es etwas, das bestraften Splines inhärent ist, wie ich sie beschrieben habe, das die folgende Aussage von Natur aus unwahr machen würde?

E[β^1]=β1 iff E[ϵ|α,T]=0
generic_user
quelle
2
Ich bin nicht qualifiziert, Ihre letzte Frage zu beantworten (obwohl dies verdächtig erscheint), aber um die Bedenken von Journals auszuräumen, sollten Sie auch ein OLS-Modell in Ihr Papier aufnehmen und zeigen, dass es nach bestimmten Maßstäben schlecht abschneidet?
Thebigdog
Sie haben die "saubere Identifizierung" nicht verletzt. Es gibt nichts inhärentes, was das semiparametrische Modell weniger in der Lage macht, eine saubere Identifizierung zu erreichen. In der Tat umfasst Ihr Modell ein lineares Modell.
@generic_user hast du jemals eine Lösung dafür erhalten? Wenn ja, können Sie Ihre Frage beantworten? Wenn nicht, können Sie eine Definition der sauberen Identifizierung angeben? Ich habe einige Perspektiven für die Veröffentlichung von Spline-bereinigten Analysen, die für diesen Fall relevant sein können oder nicht.
AdamO
Spät zur Party, aber ich denke, Sie machen sich hier Sorgen um das Falsche. Die Schiedsrichter sagen, dass sie es nicht mögen, dass Sie Komplexität hinzugefügt haben, ohne zu beweisen, dass es nützlich ist. Ein Beispiel, das einen Fehlermodus ihrer einfachen Methoden zeigt, würde dazu beitragen, die zusätzliche Komplexität zu motivieren, die Sie einführen. Es sollte möglich sein, zu konstruieren (oder noch besser ein Beispiel aus der Praxis zu finden), wo Splines benötigt werden, um einen Kausalzusammenhang richtig zu identifizieren.
Paul
Wenn dies irgendwann veröffentlicht wurde, können Sie bitte den Namen des Papiers erwähnen? Es scheint eine interessante Anwendung zu sein.
usεr11852

Antworten:

1

Die "saubere Identifizierung" von Regressionsparametern ist kein etabliertes Konzept. Ich glaube, was der Prüfer damit meint, ist, dass Sie einen Parameter angeben sollten, der interpretierbar, überprüfbar und von geringer Dimensionalität ist und für den die Analyse anständig ist, um zu erkennen, dass eine unvoreingenommene Schätzung mit relativ guter Effizienz erhalten werden kann.

Der Wunsch nach "sauberer Identifizierung" bedeutet nicht, dass OLS das einzig geeignete Werkzeug für den Job ist. OLS ist jedoch ein theoretisch und praktisch solides Werkzeug zum Spezifizieren und Schätzen von Parametern unter einer Vielzahl von Einstellungen. Der Wunsch nach "sauberer Identifikation" schließt auch semiparametrische Folgerungen nicht aus. Der Spline erweitert ein OLS-Modell, indem (a) komplexe Darstellungen von Kovariaten erstellt werden. Die semiparametrische Inferenz beinhaltet eine flexible Modellierung, um den Einfluss von Zusatzstatistiken zu eliminieren. In Ihrem Modell scheint die Hauptexposition jedoch so gehandhabt zu werden.

Ich denke, der Rezensent wirft zwei begründete Bedenken auf. Erstens ist die Begründung für die Bestrafung. Bestrafte Regressionsmethoden sind für die Vorhersage wertvoll. Sie werden selten für Schlussfolgerungen verwendet. Bestrafte Methoden wie die Gratregression sind voreingenommen, und es ist schwierig, die Voreingenommenheit zu beschreiben oder zu bewerten. Das Ziel der Minimierung des AIC besteht darin, die besten Vorhersagen zu erhalten, keine gültigen Schlussfolgerungen. Die zweite begründete Sorge ist, ob der Spline überhaupt notwendig ist, um die Hauptexposition zu modellieren. Es ist wahr, wie Sie sagen, dass ein Spline komplexe nichtlineare Funktionsformen modellieren kann. Ein Spline vereinfacht jedoch nur sehr wenig. Es handelt sich um eine komplexe hochdimensionale Darstellung mit Knotenpunkten und Abstimmungen, die eine Ursache für die Voreingenommenheit der Forscher sein können, und Kovariaten, die für niemanden außer gut ausgebildeten Statistikern nahezu uninterpretierbar sind. Vielen statistisch signifikanten Trends, die durch Splines präzise modelliert werden, liegen lineare Approximationen zugrunde, die weder statistisch noch praktisch signifikant sind.

Wenn die funktionale Form der Hauptbelichtung falsch spezifiziert ist, ist es möglich, Huber White-Standardfehler zu verwenden, um eine konsistente und unvoreingenommene Inferenz für die Steigung der kleinsten Quadrate als Annäherung erster Ordnung an einen nichtlinearen Trend zu erhalten. Splines können Modell Präzision Variablen verwendet werden, auf dem Sie tun nicht Basis Folgerung, wenn es eine komplexe Konstruktion auf die Daten ist. Dies dient dazu, die Variabilität bei komplexer Heterogenität der Daten effektiv anzupassen und zu verringern.

Ich denke, die Kommentare der Rezensenten können durch Anpassen eines linearen Modells für die Belichtung und Durchführen von Inferenzen mit Huber White Sandwich-Fehlern berücksichtigt werden. Wenn die Inferenz größtenteils mit der Spline-Inferenz übereinstimmt, kommentieren Sie das Spline-Modell, sofern es einen krummlinigen Trend zwischen Belichtung und Reaktion zeigt.

AdamO
quelle