Ich verstehe, dass die grundlegende Definition der Endogenität darin besteht, dass nicht erfüllt ist, aber was bedeutet dies im Sinne der realen Welt? Ich habe den Wikipedia-Artikel mit dem Beispiel für Angebot und Nachfrage gelesen und versucht, einen Sinn daraus zu ziehen, aber es hat nicht wirklich geholfen. Ich habe die andere Beschreibung von endogen und exogen als innerhalb des Systems und außerhalb des Systems zu sein gehört, und das ergibt für mich immer noch keinen Sinn.
regression
causality
instrumental-variables
user25901
quelle
quelle
R
.Antworten:
Die Antwort von JohnRos ist sehr gut. Im Klartext bedeutet Endogenität, dass Sie die Ursache falsch verstanden haben. Dass das Modell, das Sie aufgeschrieben und geschätzt haben, die Wirkungsweise der Kausalität in der realen Welt nicht richtig erfasst. Wenn du schreibst:
Sie können sich diese Gleichung auf verschiedene Arten vorstellen. Sie können sich dies als eine bequeme Methode vorstellen, um basierend auf den -Werten vorherzusagen . Sie können sich dies als eine bequeme Methode zur Modellierung von . In beiden Fällen gibt es keine Endogenität, und Sie müssen sich darüber keine Sorgen machen.X E { Y | X }Y X E{Y|X}
Sie können sich die Gleichung jedoch auch als Verkörperung der Kausalität vorstellen. Sie können sich als Antwort auf die Frage : "Was würde mit geschehen, wenn ich in dieses System eingreifen und experimentell um 1 erhöhen würde ?" Wenn Sie so darüber nachdenken möchten, müssen Sie bei der Schätzung von OLS davon ausgehen, dass: Y Xβ1 Y X
Ein Ausfall von 5 führt im Allgemeinen zu oder, nicht ganz gleichbedeutend, zu . Instrumentelle Variablen sind eine Möglichkeit, die Tatsache zu korrigieren, dass Sie die Ursache falsch verstanden haben (indem Sie eine andere, andere, kausale Annahme treffen). Eine perfekt durchgeführte, randomisierte, kontrollierte Studie ist ein Weg , 3-5 zur Wahrheit zu zwingen . Wenn Sie Zufallsprinzip auswählen , wird es nicht durch , oder irgendetwas anderes verursacht. Sogenannte "Natural Experiment" -Methoden sind Versuche, besondere Umstände in der Welt herauszufinden, in denen 3-5 wahr sind, selbst wenn wir nicht glauben, dass 3-5 normalerweise wahr sind.C o v ( X , ≤ ) ≤ 0 X Y ≤E{ϵ|X}≠0 Cov(X,ϵ)≠0 X Y ϵ
In JohnRos 'Beispiel benötigen Sie zur Berechnung des Lohnwerts von Bildung eine kausale Interpretation von , aber es gibt gute Gründe zu glauben, dass 3 oder 5 falsch sind.β1
Ihre Verwirrung ist jedoch verständlich. In Kursen nach dem linearen Modell ist es sehr typisch, dass der Kursleiter die kausale Interpretation von ich oben angegeben habe, während er vorgibt, keine Kausalität einzuführen, und vorgibt, dass "alles nur Statistik ist". Es ist eine feige Lüge, aber es ist auch sehr verbreitet.β1
Tatsächlich ist es Teil eines größeren Phänomens in der Biomedizin und den Sozialwissenschaften. Es ist fast immer so, dass wir versuchen, die kausale Wirkung von auf zu bestimmen - darum geht es doch in der Wissenschaft. Andererseits gibt es auch fast immer eine Geschichte, die zu dem Schluss führt, dass eine von 3-5 falsch ist. Es gibt also eine Art von praktizierter, fließender, uneindeutiger Unehrlichkeit, in der wir Einwände austauschen, indem wir sagen, dass wir nur Assoziationsarbeit leisten und dann die kausale Interpretation an anderer Stelle zurückschleichen (normalerweise in den Abschnitten Einleitung und Schlussfolgerung des Papiers).YX Y
Wenn Sie wirklich interessiert sind, sollten Sie Judea Perl lesen . James Heckman ist auch gut.
quelle
Lassen Sie mich ein Beispiel verwenden:
Angenommen, Sie möchten den (kausalen) Effekt von Bildung auf das Einkommen quantifizieren. Sie nehmen Bildungsjahre und Einkommensdaten und bilden sich gegeneinander zurück. Hast du wiedergefunden, was du wolltest? Wahrscheinlich nicht! Dies liegt daran, dass das Einkommen auch durch andere Dinge als Bildung verursacht wird, die jedoch mit Bildung korrelieren. Nennen wir sie "Geschicklichkeit": Wir können davon ausgehen, dass Bildungsjahre von "Geschicklichkeit" betroffen sind. Je qualifizierter Sie sind, desto einfacher ist es, eine Ausbildung zu erhalten. Wenn Sie also die Bildungsjahre auf das Einkommen reduzieren, absorbiert der Schätzer für den Bildungseffekt den Effekt der "Fertigkeit" und Sie erhalten eine zu optimistische Schätzung der Rückkehr zur Bildung. Dies bedeutet, dass die Auswirkungen von Bildung auf das Einkommen (nach oben) voreingenommen sind, da Bildung nicht einkommensexogen ist.
Endogenität ist nur dann ein Problem, wenn Sie kausale Effekte wiederherstellen möchten (im Gegensatz zu bloßen Korrelationen). Wenn Sie ein Experiment entwerfen können, können Sie durch zufällige Zuweisung sicherstellen, dass . Leider ist dies in den Sozialwissenschaften normalerweise nicht möglich.Cov(X,ϵ)=0
quelle
User25901 sucht nach einer einfachen Erklärung, was die Begriffe exogen und endogen bedeuten. Antworten mit arkanen Beispielen oder mathematischen Definitionen beantworten die gestellte Frage nicht wirklich.
Wie bekomme ich ein gutes Verständnis für diese beiden Begriffe?
Folgendes habe ich mir ausgedacht:
Exo - extern, außen Endo - intern, innen -gen - mit Ursprung in
Exogen: Eine Variable ist für ein Modell exogen, wenn sie nicht durch andere Parameter und Variablen im Modell bestimmt wird, sondern extern festgelegt wird und alle Änderungen daran von externen Kräften herrühren.
Endogen: Eine Variable ist in einem Modell endogen, wenn sie zumindest teilweise von anderen Parametern und Variablen in einem Modell abhängt.
quelle
Das sind zweistufige kleinste Quadrate, was fast dem Wert von IV entspricht.
quelle
In der Regression wollen wir den quantitativen Einfluss einer unabhängigen Variablen (von der wir annehmen, dass sie exogen ist und selbst nicht von etwas anderem abhängig ist) auf eine identifizierte abhängige Variable erfassen. Wir wollen wissen, welchen Nettoeffekt eine exogene Variable auf eine abhängige Variable hat - das heißt, die unabhängige Variable sollte frei von jeglichem Einfluss einer anderen Variablen sein. Eine schnelle Möglichkeit, um festzustellen, ob die Regression unter dem Problem der Endogenität leidet, besteht darin, die Korrelation zwischen der unabhängigen Variablen und den Residuen zu überprüfen. Dies ist jedoch nur eine grobe Überprüfung, da ansonsten formale Tests der Endogenität durchgeführt werden müssen.
quelle