Endogenität versus unbeobachtete Heterogenität

13

Was ist der Unterschied zwischen Endogenität und nicht beobachteter Heterogenität? Ich weiß, dass Endogenität zum Beispiel von ausgelassenen Variablen herrührt. Soweit ich weiß, verursacht eine unbeobachtete Heterogenität dasselbe Problem. Aber wo genau liegt der Unterschied zwischen diesen beiden Begriffen?

MarkDollar
quelle
unbeobachtete heterogenität kann unterschiedliche interpretationen haben (google gibt beispielsweise keine eindeutige definition), können sie bitte einen referenz anführen oder die genaue definition angeben, die erklärt werden soll.
mpiktas
@mpiktas: Ich analysiere das Problem ausgelassener Variablen in einer Regression. Das Weglassen von Variablen verursacht Probleme mit der Konsistenz des Schätzers. Es gibt eine Reihe anderer Probleme, die Inkonsistenzen verursachen (zum Beispiel gleichzeitige Kausalität und Messfehler). Alle diese Probleme sind als Endogenität bekannt. Aber in diesem Zusammenhang hört man oft das Wort unbeobachtete Heterogenität. Und ich bin mir nicht sicher, ob dies ein Synonym für Endogenität ist? Tut mir leid, ich kann Ihnen keine weiteren Informationen geben, da ich keine habe (Referenzen sind auf Polnisch, Sie würden es nicht verstehen :))
MarkDollar
3
probier mich aus, ich kenne russisch und die formeln sind für alle sprachen gleich.
mpiktas

Antworten:

13

Die Begriffe Endogenität und unbeobachtete Heterogenität beziehen sich oft auf dasselbe, aber die Verwendung variiert etwas, auch innerhalb der Wirtschaft, der Disziplin, die ich mit den Begriffen am meisten verbinde.

In einer Regressionsgleichung ist eine erklärende Variable endogen wenn sie mit dem Fehlerterm korreliert ist.

Die Endogenität wird häufig mit drei Ursachen beschrieben: ausgelassene Variablen, Messfehler und Gleichzeitigkeit. Obwohl es oft hilfreich ist, diese "Quellen" getrennt zu erwähnen, kommt es manchmal zu Verwirrung, weil sie nicht wirklich verschieden sind. Stellen Sie sich eine Regression vor, die die Auswirkungen der Bildung auf die Löhne vorhersagt. Vielleicht ist unser Maß für Bildung einfach die Anzahl der Jahre, die jemand in der formalen Bildung verbracht hat, unabhängig von der Art der Bildung. Wenn ich eine klare Vorstellung davon habe, welche Art von Bildung die Löhne beeinflusst, kann ich diese Situation als Messfehler in der Bildungsvariablen bezeichnen. Alternativ könnte ich die Situation als Problem ausgelassener Variablen beschreiben (die Variablen, die die Art der Ausbildung angeben).

Vielleicht wirken sich die Löhne auch auf Bildungsentscheidungen aus. Wenn Löhne und Ausbildung gleichzeitig gemessen werden, ist dies ein Beispiel für Gleichzeitigkeit, aber auch dies könnte durch ausgelassene Variablen umformuliert werden.

Nicht beobachtete Heterogenität ist einfach eine Variation / Differenz zwischen Fällen, die nicht gemessen werden. Wenn Sie Endogenität verstehen, verstehen Sie meines Erachtens die Auswirkungen einer nicht beobachteten Heterogenität in einem Regressionskontext.

Michael Bishop
quelle
1
Ich würde auch die Autoregression mit autokorrelierten Fehlern und die Stichprobenauswahl einbeziehen, da zusätzliche Möglichkeiten für die Entstehung von Endogenität bestehen können.
Dimitriy V. Masterov
1
@ DimitriyV.Masterov, Danke, dass du diese Konzepte erwähnt hast. Ich denke, sie erweitern meinen Standpunkt. Könnte beispielsweise ein gegebener Fall einer Autoregression mit autokorrelierten Fehlern oder eine Stichprobenauswahl nicht als Problem ausgelassener Variablen umformuliert werden? Ich weiß, dass ich dir nichts beibringe. Ich möchte, dass die Lernenden darüber nachdenken, wie diese Begriffe zusammenhängen, und erkennen, dass dasselbe statistische Problem auf viele Arten konzeptualisiert werden kann.
Michael Bishop
13

Ich stimme mit @ Michaels Beschreibung der Endogenität überein - hier geht es um ein Problem mit den Variablen, die Sie einschließen, und deren Beziehung zu den Variablen, die Sie nicht einschließen (dh dem Inhalt des Fehlerbegriffs).

Bei der nicht beobachteten Heterogenität handelt es sich in der Regel um nicht beobachtbare Bestandteile der von Ihnen geschätzten Effekte. Wenn Sie mit @ Michaels Bildungsbeispiel fortfahren, könnte die unbeobachtete Heterogenität darin bestehen, dass einige Menschen höhere Erträge (z. B. höhere Löhne) aus dem Schulbesuch erzielen als andere. Lassen Sie die Rendite für Person seine β + b i mit E ( b i ) = 0 . Wir haben y i = x i ( β + b i ) + w ' i γ + ϵ i , wobeiiβ+biE(bi)=0

yi=xi(β+bi)+wiγ+ϵi,
yixiwixiϵi

yi=xiβ+wiγ+(ϵi+bxi)=xiβ+wiγ+ϵ~i
See that the included variable xi is correlated with the error term ϵ~i, inducing the same problems as the case of endogeneity.
Charlie
quelle
3

I understand heterogeneity to be any difference between individuals. Observed heterogeneity usually consists of the covariates and unobserved heterogeneity consists of any unobserved difference like ability or effort.

Endogeneity refers to the relationship between the observed and unobserved variables, namely that they are dependent on one another.

dan
quelle
2

To wrap it up:

  • Unobserved heterogeneity is one possible cause of endogeneity.
  • Endogeneity is therefore the broader term.
  • Unobserved heterogeneity implies endogeneity but not the other way around.
petermeissner
quelle
2

the difference between the unobserved heterogeniety and endogeniety in the case of omitted variables lies in the orthogonality assumptions made. Whereas in the former, the assumption is that the unobserved omitted variable is independent of the observed (included) explanatory variable x,...in the latter this assumption is relaxed such that the unobserved (omitted) variable is correlated with some of the observed (included) explanatory variable.

jumens
quelle
-1

Easy answer, without explanation because it is not wanted: if the omitted variables that cause endogeneity are not observable we call it unobserved heterogeneity. Easy :)

E.Brady
quelle