Betrachten sie ein lineares unbeobachteten Effekt - Modell des Typs:
Was habe ich immer gefragt: Wann ist „fixed“ wirklich?
Dies mag trivial erscheinen, aber ich möchte Ihnen zwei Beispiele für meinen Grund dafür nennen.
Angenommen, wir interviewen heute eine Person und fragen nach ihrem Einkommen, Gewicht usw., damit wir unser . In den nächsten 10 Tagen gehen wir zu derselben Person und interviewen sie jeden Tag aufs Neue, sodass wir Paneldaten für sie haben. Sollten wir unbeobachtete Merkmale für diesen Zeitraum von 10 Tagen als fest behandeln, wenn sie sich sicherlich zu einem anderen Zeitpunkt in der Zukunft ändern werden? In 10 Tagen wird sich ihre persönliche Fähigkeit vielleicht nicht ändern, aber sie wird es, wenn sie älter wird. Oder extremer gefragt: Wenn ich diese Person 10 Stunden am Tag stündlich interviewe, werden ihre unbeobachteten Merkmale wahrscheinlich in dieser "Stichprobe" behoben, aber wie nützlich ist das?
Nehmen wir an, wir interviewen stattdessen jeden Monat eine Person von Anfang bis zum Ende ihres Lebens, etwa 85 Jahre lang. Was bleibt in dieser Zeit fest? Geburtsort, Geschlecht und Augenfarbe sind sehr wahrscheinlich, aber ansonsten fällt mir kaum etwas anderes ein. Aber was noch wichtiger ist: Was ist, wenn es eine Eigenschaft gibt, die sich an einem einzelnen Punkt in ihrem Leben ändert, die Änderung aber unendlich gering ist? Dann ist es kein fester Effekt mehr, weil er sich ändert, wenn diese Eigenschaft in der Praxis quasi fest ist.
Vom statistischen Standpunkt aus ist relativ klar, was ein fester Effekt ist, aber vom intuitiven Standpunkt aus finde ich es schwierig, diesen zu verstehen. Vielleicht hatte jemand anderes diese Gedanken und kam auf einen Streit darüber, wann ein fester Effekt wirklich ein fester Effekt ist. Ich würde andere Gedanken zu diesem Thema sehr schätzen.
"all models are wrong, but some are useful"
- George Box .Antworten:
Wenn Sie an dieser Formulierung zur kausalen Inferenz über interessiert sind, müssen die unbekannten Größen, die durch c i dargestellt werden, nur für die Dauer der Studie / der Daten für feste Effekte stabil sein, um die relevante kausale Größe zu identifizieren.β ci
Wenn Sie befürchten, dass die durch dargestellten Größen auch in diesem Zeitraum nicht stabil sind, werden feste Effekte nicht das tun, was Sie wollen. Dann können Sie zufällige Effekte stattdessen verwenden, obwohl , wenn Sie erwarten Korrelation zwischen zufälligen c i und X i Sie Bedingung wollen würden c i auf ˉ X i in einem Multi - Level - Setup. Die Besorgnis über diese Korrelation ist oft eine der Motive für eine Formulierung mit festen Effekten, da Sie sich unter vielen (aber nicht allen) Umständen dann nicht darum kümmern müssen.ci ci Xi ci X¯i
Kurz gesagt, Ihre Besorgnis über die Variation der Mengen, die durch ist sehr vernünftig, wirkt sich jedoch hauptsächlich auf die Daten für den Zeitraum aus, den Sie haben, und nicht auf die Zeiträume, die Sie möglicherweise hatten oder die Sie möglicherweise irgendwann haben, aber nicht haben.ci
quelle
Die Unterscheidung zwischen einem festen Effekt und einem zufälligen Effekt hat in der Regel keine Auswirkungen auf die Schätzungen (Edit: zumindest in den unkorrelierten Fällen des einfachen Lehrbuchs), abgesehen von einer Frage der Effizienz, aber erheblichen Auswirkungen auf die Prüfung.
Zum Testen sollten Sie sich die Frage stellen, welchen Rauschpegel Ihr Signal übertreffen soll. Auf welche Bevölkerungsgruppe möchten Sie Ihre Ergebnisse verallgemeinern? Mit Beispiel (1): Soll es die Variabilität über denselben Tag, einen längeren Zeitraum oder die Variabilität über verschiedene Personen sein?
Je mehr Varianzkomponenten Sie ableiten, desto stärker ist Ihr wissenschaftlicher Befund und desto höher sind die Replikationschancen. Es gibt natürlich eine Grenze für das Ausmaß der Generalisierung, nach der Sie fragen können, da nicht nur das Rauschen stärker wird, sondern auch das Signal ( )) schwächer wird. Um dies zu sehen, stellen Sie sich vor, dass E ( c i ) die erwartete Auswirkung von X i auf das Gewicht ist, jedoch nicht über einige Lebensperioden eines einzelnen Subjekts, sondern über alle Säugetiere .E(ci E(ci) Xi
quelle
Das kann als zufälliger Spaziergang angesehen werden, indem man in der Zeit weiter zurückgeht:
Ich könnte für Ihr spezielles Beispiel der Umfrage vermuten, dass Fragen zur Messung der Flusstypdaten (z. B. Einkommen, Gewicht) sinnvoll sein können, da zufällige Spaziergänge über besonders kurze Zeiträume erfolgen. Daten über die Bestandsart (z. B. wie viele Kaffees Sie heute getrunken haben ) scheinen jedoch eher pervers zu sein.
quelle