Wann ist ein fester Effekt wirklich fest?

12

Betrachten sie ein lineares unbeobachteten Effekt - Modell des Typs:

y_{i t} = X_{i t} β + c_{i} + e_{i t}

$y_{it} = X_{it}\beta + c_{i} + e_{it}$ wobei

c

$c$ eine unbeobachtet aber zeitinvariante Charakteristik und

e

$e$ ist ein Fehler,

i

$i$ und

t

$t$ - Index Einzelbeobachtungen und die Zeit, beziehungsweise. Der typische Ansatz bei einer Regression mit festen Effekten (FE) besteht darin,

c_{i}

$c_{i}$ über einzelne Dummies (LSDV) / De-Meaning oder durch erstes Differenzieren zu entfernen .

Was habe ich immer gefragt: Wann ist $c_{i}$ „fixed“ wirklich?

Dies mag trivial erscheinen, aber ich möchte Ihnen zwei Beispiele für meinen Grund dafür nennen.

Angenommen, wir interviewen heute eine Person und fragen nach ihrem Einkommen, Gewicht usw., damit wir unser $X$ . In den nächsten 10 Tagen gehen wir zu derselben Person und interviewen sie jeden Tag aufs Neue, sodass wir Paneldaten für sie haben. Sollten wir unbeobachtete Merkmale für diesen Zeitraum von 10 Tagen als fest behandeln, wenn sie sich sicherlich zu einem anderen Zeitpunkt in der Zukunft ändern werden? In 10 Tagen wird sich ihre persönliche Fähigkeit vielleicht nicht ändern, aber sie wird es, wenn sie älter wird. Oder extremer gefragt: Wenn ich diese Person 10 Stunden am Tag stündlich interviewe, werden ihre unbeobachteten Merkmale wahrscheinlich in dieser "Stichprobe" behoben, aber wie nützlich ist das?
Nehmen wir an, wir interviewen stattdessen jeden Monat eine Person von Anfang bis zum Ende ihres Lebens, etwa 85 Jahre lang. Was bleibt in dieser Zeit fest? Geburtsort, Geschlecht und Augenfarbe sind sehr wahrscheinlich, aber ansonsten fällt mir kaum etwas anderes ein. Aber was noch wichtiger ist: Was ist, wenn es eine Eigenschaft gibt, die sich an einem einzelnen Punkt in ihrem Leben ändert, die Änderung aber unendlich gering ist? Dann ist es kein fester Effekt mehr, weil er sich ändert, wenn diese Eigenschaft in der Praxis quasi fest ist.

Vom statistischen Standpunkt aus ist relativ klar, was ein fester Effekt ist, aber vom intuitiven Standpunkt aus finde ich es schwierig, diesen zu verstehen. Vielleicht hatte jemand anderes diese Gedanken und kam auf einen Streit darüber, wann ein fester Effekt wirklich ein fester Effekt ist. Ich würde andere Gedanken zu diesem Thema sehr schätzen.

fixed-effects-model philosophical Andy
quelle

2

+1, gute Frage & gute Antworten. Vielleicht lohnt es sich, sich daran zu erinnern, "all models are wrong, but some are useful"- George Box .

gung - Wiedereinsetzung von Monica

Ich bin wahrscheinlich verwirrt darüber, aber es ist nicht das Kontinuum: 1) wenn

für alle

, dann hast du ein gepooltes Modell, 2) wenn

für alle

(Dummy-Variablen für Gruppen, die "Jahr" oder "Tag" enthalten können), haben Sie ein FE-Modell, und 3) wenn

als Verteilung behandelt wird, haben Sie ein RE-Modell. Siehe: userwww.service.emory.edu/~tclark7/randomeffects.pdf .

c_{i}

$c_i$

i

$i$

c_{i}

$c_i$

z_{j [i]}

$z_{j[i]}$

c_{j [i]}

$c_{j[i]}$

Wayne

9

Wenn Sie an dieser Formulierung zur kausalen Inferenz über interessiert sind, müssen die unbekannten Größen, die durch nur für die Dauer der Studie / der Daten für feste Effekte stabil sein, um die relevante kausale Größe zu identifizieren. $\beta$ $c_i$

Wenn Sie befürchten, dass die durch dargestellten Größen auch in diesem Zeitraum nicht stabil sind, werden feste Effekte nicht das tun, was Sie wollen. Dann können Sie zufällige Effekte stattdessen verwenden, obwohl , wenn Sie erwarten Korrelation zwischen zufälligen und Sie Bedingung wollen würden auf in einem Multi - Level - Setup. Die Besorgnis über diese Korrelation ist oft eine der Motive für eine Formulierung mit festen Effekten, da Sie sich unter vielen (aber nicht allen) Umständen dann nicht darum kümmern müssen. $c_i$ $c_i$ $X_i$ $c_i$ $\bar{X}_i$

Kurz gesagt, Ihre Besorgnis über die Variation der Mengen, die durch ist sehr vernünftig, wirkt sich jedoch hauptsächlich auf die Daten für den Zeitraum aus, den Sie haben, und nicht auf die Zeiträume, die Sie möglicherweise hatten oder die Sie möglicherweise irgendwann haben, aber nicht haben. $c_i$

Conjugateprior
quelle

+1 Diese Antwort gefällt mir. Aber was ist mit einer unglaublich kleinen Änderung an etwas, das über den Abtastzeitraum behoben werden soll? Wenn meine Person in der 10-Tage-Stichprobe am 6. Tag ihren Kopf trifft und danach weniger intelligent ist als die Gehirnzellen, die gestorben sind (nur als triviales Beispiel), kann ihre Fähigkeit dennoch als fester Effekt behandelt werden, wenn dies der Fall ist ist fast behoben?

Andy

1

Sicher. Denken Sie vielleicht so darüber nach: Es ist der Parameter , der festgelegt ist, und er repräsentiert möglicherweise etwas in der Welt, das "wirklich" konstant ist, oder er repräsentiert möglicherweise nicht, z. B., wenn er den Durchschnitt von etwas darstellt, das tatsächlich variiert. Die Frage ist: Welchen Unterschied macht es, wenn man einen festen Effekt erzielt und nicht etwas anderes. Im kausalen Inferenz Fall ist die Frage: fixed Wirkungen annehmend sinken Verwechselung mehr als die kleinen Variationen durch den Parameter nicht erfaßten links Anstieg Verwechselung.

Conjugateprior

@Andy: Wenn Sie anfangen, über eine Kopfnuss zu sprechen, die den IQ von jemandem ändert, weil ein paar Gehirnzellen traumatisiert wurden, wo hört das auf? Nichts, was Sie in der realen Welt messen, ist so festgelegt, dass es sich nicht (unendlich) von Moment zu Moment ändert, wenn Sie es genau genug messen können. Sie müssen einfach vernünftige Entscheidungen treffen und diese bei der Angabe Ihrer Ergebnisse ausdrücklich berücksichtigen. Wie Conjugateprior sagt, sind feste Effekte auch ein anderes Konzept als "unveränderlich" und beziehen sich sowohl auf eine bestimmte Sache (Parameter) als auch auf Ihr bestimmtes Ziel (Population, Gruppe usw.).

Wayne

Sie haben Recht, dass das Beispiel mit den Gehirnzellen etwas weit hergeholt ist. Ich wollte nur mehr über die Natur der festen Effekte nachdenken, da die meisten Lehrbücher und Vorlesungen zu diesem intuitiven Aspekt eher leise sind. Sicher, sie geben Beispiele, aber keine davon würde meine Fragen beantworten. Zu diesem Zweck fand ich es sehr nützlich, diese Frage hier anzusprechen, und die bisherigen Antworten und Kommentare waren sehr nützlich.

Andy

2

Die Unterscheidung zwischen einem festen Effekt und einem zufälligen Effekt hat in der Regel keine Auswirkungen auf die Schätzungen (Edit: zumindest in den unkorrelierten Fällen des einfachen Lehrbuchs), abgesehen von einer Frage der Effizienz, aber erheblichen Auswirkungen auf die Prüfung.

Zum Testen sollten Sie sich die Frage stellen, welchen Rauschpegel Ihr Signal übertreffen soll. Auf welche Bevölkerungsgruppe möchten Sie Ihre Ergebnisse verallgemeinern? Mit Beispiel (1): Soll es die Variabilität über denselben Tag, einen längeren Zeitraum oder die Variabilität über verschiedene Personen sein?

Je mehr Varianzkomponenten Sie ableiten, desto stärker ist Ihr wissenschaftlicher Befund und desto höher sind die Replikationschancen. Es gibt natürlich eine Grenze für das Ausmaß der Generalisierung, nach der Sie fragen können, da nicht nur das Rauschen stärker wird, sondern auch das Signal ( )) schwächer wird. Um dies zu sehen, stellen Sie sich vor, dass die erwartete Auswirkung von auf das Gewicht ist, jedoch nicht über einige Lebensperioden eines einzelnen Subjekts, sondern über alle Säugetiere . $E(c_i$ $E(c_i)$ $X_i$

JohnRos
quelle

X

$X$

c

$c$

X

$X$

c

$c$

c_{i}

$c_i$

E (c_{i})

$E(c_i)$

@Andy: Ich sehe keinen Grund, Korrelationen zwischen den Effekten und dem Rauschen in RE nicht zuzulassen, aber wenn wir uns auf den Rest der Antwort einigen, bearbeite ich meine Antwort lieber einfach.

JohnRos

2

$X_{it} \beta$

y_{i t} = c_{i} + e_{i t}

$y_{it} = c_i + e_{it}$

Das kann als zufälliger Spaziergang angesehen werden, indem man in der Zeit weiter zurückgeht:

\begin{aligned} y_{i t} & = c_{i} + e_{i t} \\ y_{i t - 1} & = c_{i} + e_{i t - 1} \\ y_{i t} - y_{i t - 1} & = e_{i t} - e_{i t - 1} \end{aligned}

$\begin{align} y_{it} &= c_i + e_{it} \\ y_{it-1} &= c_i + e_{it-1} \\ y_{it} - y_{it-1} &= e_{it} - e_{it-1} \end{align}$

$X_{it} \beta$ $e_{it}$

$c_i$

Ich könnte für Ihr spezielles Beispiel der Umfrage vermuten, dass Fragen zur Messung der Flusstypdaten (z. B. Einkommen, Gewicht) sinnvoll sein können, da zufällige Spaziergänge über besonders kurze Zeiträume erfolgen. Daten über die Bestandsart (z. B. wie viele Kaffees Sie heute getrunken haben ) scheinen jedoch eher pervers zu sein.

Andy W
quelle

+1 Danke für den Link und deine Antwort! Ich bin froh, dass diese Frage immer noch auf Interesse stößt und dass noch mehr hinzugefügt werden kann. Das war aufschlussreich.

Andy

Wann ist ein fester Effekt wirklich fest?

Antworten: