Konzepte hinter Modellen mit festen / zufälligen Effekten

14
  1. Kann mir jemand helfen, Modelle mit festen / zufälligen Effekten zu verstehen? Sie können entweder auf Ihre eigene Weise erklären, ob Sie diese Konzepte verdaut haben, oder mich an die Ressource (Buch, Notizen, Website) mit einer bestimmten Adresse (Seitenzahl, Kapitel usw.) weiterleiten, damit ich sie ohne Verwirrung lernen kann.
  2. Stimmt das: "Wir haben feste Effekte im Allgemeinen und zufällige Effekte sind Sonderfälle"? Ich wäre besonders dankbar, wenn ich Hilfe bekommen könnte, wenn die Beschreibung von allgemeinen Modellen zu spezifischen Modellen mit festen und zufälligen Effekten wechselt
Stat-R
quelle
2
von möglichem Interesse: stats.stackexchange.com/questions/4700/…
ocram
Siehe die Buchverweise auf dem Tag für gemischte Modelle . Nummer 1 wird in (einigen) Einführungskapiteln für alle von mir gelesenen mehrstufigen Modellierungsbücher angesprochen.
Andy W
1
Von möglichem Interesse: Was ist der Unterschied zwischen Zufallseffekt-, Fixeffekt- und Randmodell?
gung - Reinstate Monica

Antworten:

13

Dies scheint eine große Frage zu sein, da sie ein Nomenklaturproblem in der Ökonometrie berührt, das die Schüler beim Wechsel zu statistischer Literatur (Bücher, Lehrer usw.) stört. Ich schlage vor, Sie http://www.amazon.com/Econometric-Analysis-Cross-Section-Panel/dp/0262232197 Kapitel 10.

Angenommen, Ihre interessierende Variable wird in zwei Dimensionen beobachtet (z. B. Individuen und Zeit), hängt von den beobachteten Merkmalen x i t und den nicht beobachteten Merkmalen u i t ab . Wenn y i t beobachteten Löhne sind so können wir behaupten , dass es durch beobachtet (Bildung) bestimmt ist und unbeobachtet Fähigkeiten (Talente, etc.). Es ist jedoch klar, dass unbeobachtete Fähigkeiten mit dem Bildungsniveau korrelieren können. Das führt also zu der Fehlerzerlegung: u i t = e i t + v i wobei vyitxituityituit=eit+viviist die (zufällige) Fehlerkomponente, von der wir annehmen können, dass sie mit den korreliert ist . dh v i modelliert die nicht beobachteten Fähigkeiten des Individuums als zufällige individuelle Komponente.xvi

So wird das Modell:

yit=jθjxj+eit+vi

Dieses Modell wird in der Regel als ein FE - Modell markiert, sondern als Wooldridge argumentiert , wäre es klüger, es anzurufen mit korrelierten Fehlerkomponente RE Modell während , wenn nicht auf den korrelierten x ' s es ein Modell RE wird. Also diese Antwort Ihre zweite Frage ist die FE - Setup allgemeinere , wie es für die Korrelation zwischen ermöglicht v i und die x ' s .vixsvixs

Ältere Bücher in der Ökonometrie beziehen sich in der Regel auf ein Modell mit individuellen spezifischen Konstanten. Leider ist dies in der heutigen Literatur immer noch vorhanden (ich vermute, dass sie in der Statistik diese Verwirrung nie hatten. Ich schlage auf jeden Fall die Wooldridge-Vorlesungen vor, die das potenzielle Missverständnisproblem aufzeigen )

JDav
quelle
Vielen Dank für den Link zu (1) Excellent Resource und (2) nette Erklärung
Stat-R
1
Dies ist eine andere Art, diese Ideen zu erklären, als ich es gewohnt bin zu sehen, aber wirklich gut gemacht. +1
gung - Wiedereinsetzung von Monica
15

Mein bestes Beispiel für einen zufälligen Effekt in einem Modell stammen aus klinischen Studien. In einer klinischen Studie werden Patienten aus verschiedenen Krankenhäusern (sogenannte Standorte) eingeschlossen. Die Websites werden aus einer Vielzahl potenzieller Websites ausgewählt. Es kann ortsbezogene Faktoren geben, die das Ansprechen auf die Behandlung beeinflussen. In einem linearen Modell möchten Sie häufig die Site als Haupteffekt einbeziehen.

Aber ist es angemessen, eine Website als festen Effekt zu haben? Das machen wir im Allgemeinen nicht. Wir können uns die Standorte, die wir für die Studie ausgewählt haben, häufig als Zufallsstichprobe aus den potenziellen Standorten vorstellen, die wir hätten auswählen können. Dies mag nicht ganz der Fall sein, aber es kann eine vernünftigere Annahme sein als die Annahme, dass der Site-Effekt behoben ist. Wenn wir also die Stelle als zufälligen Effekt behandeln, können wir die Variabilität des Stelleneffekts berücksichtigen, die durch die Auswahl einer Gruppe von k Stellen aus einer Population mit N Stellen entsteht.

Die allgemeine Idee ist, dass die Gruppe nicht festgelegt ist, sondern aus einer größeren Population ausgewählt wurde, und dass andere Auswahlmöglichkeiten für die Gruppe möglich waren und zu unterschiedlichen Ergebnissen geführt hätten. Wenn Sie es also als zufälligen Effekt behandeln, wird diese Art von Variabilität in das Modell einbezogen, die Sie von einem festen Effekt nicht erhalten würden.

Michael R. Chernick
quelle
@ocram Referenz ist sehr interessant. Es wird auf die Heterogenität in Bezug auf die FE-Definitionen hingewiesen. Aber auf welche Definition bezieht sich Stat-R? Seine zweite Frage legt nahe, dass FE als RE mit korrelierter Zufallskomponente betrachtet wird. Unter dieser Definition und in Ihrem Beispiel würde ein FE bedeuten, dass eine Behandlung mit einem nicht beobachteten (oder ausgelassenen) Standorteffekt korreliert werden könnte, oder?
JDav
2
Schön - Ihr letzter Absatz ist eine sehr prägnante Formulierung. +1
Luke
1
@MichaelChernick: schönes Beispiel. Sie argumentieren also, dass der Krankenhausstandort als zufälliger und nicht als fester Effekt behandelt werden sollte. Aber was wäre der tatsächliche Unterschied im Ergebnis zwischen diesen beiden Optionen? Wenn wir es als fix behandeln, erhalten wir für jedes Krankenhaus einen Regressionskoeffizienten und können z. B. testen, ob der Haupteffekt des Krankenhauses signifikant ist. Wenn wir zufällig behandeln, erhalten wir nicht für jedes Krankenhaus einen Regressionskoeffizienten (richtig?). Können wir die Hauptwirkung des Krankenhauses noch testen? Was noch wichtiger ist: Erhöht / verringert es möglicherweise die Stärke anderer Haupteffekte / Wechselwirkungen im Modell?
Amöbe sagt Reinstate Monica
12
  1. Ich bin mir nicht sicher über ein Buch, aber hier ist ein Beispiel. Angenommen, wir haben eine Stichprobe von Geburtsgewichten einer großen Gruppe von Babys über einen längeren Zeitraum. Das Gewicht von Babys, die zur selben Frau geboren wurden, wäre ähnlicher als das Gewicht von Babys, die zu verschiedenen Müttern geboren wurden. Jungen sind auch schwerer als Mädchen.

Ein Modell mit festen Effekten, bei dem die Gewichtskorrelation zwischen Babys, die zur selben Mutter geboren wurden, ignoriert wird, lautet also:

Modell 1. mittleres Geburtsgewicht = Abschnitt + Geschlecht

Ein weiteres Modell mit festen Effekten, das diese Korrelation berücksichtigt, ist:

Modell 2. mittleres Geburtsgewicht = Abschnitt + Geschlecht + Mutter_ID

Zunächst sind wir jedoch möglicherweise nicht an den Auswirkungen für jede einzelne Mutter interessiert. Wir betrachten die Mutter auch als zufällige Mutter aus der Gesamtbevölkerung aller Mütter. Also konstruieren wir ein gemischtes Modell mit einem festen Effekt für das Geschlecht und einem zufälligen Effekt (dh einem zufälligen Schnittpunkt) für die Mutter:

Modell 3: mittleres Geburtsgewicht = Abschnitt + Geschlecht + u

Dies wird für jede Mutter anders sein, genau wie in Modell 2, aber es wird nicht wirklich geschätzt. Vielmehr wird nur die Varianz geschätzt. Diese Varianzschätzung gibt uns eine Vorstellung über den Grad der Häufung von Gewichten nach Mutter.

Hoffe das ergibt einen Sinn.

Gavin
quelle