Ich möchte den Unterschied zwischen Paneldatenanalyse und gemischter Modellanalyse kennen. Meines Wissens verwenden Paneldaten und gemischte Modelle feste und zufällige Effekte. Wenn ja, warum haben sie unterschiedliche Namen? Oder sind sie auch?
Ich habe den folgenden Beitrag gelesen, in dem die Definition des festen, zufälligen und gemischten Effekts beschrieben wird, aber meine Frage nicht genau beantwortet: Was ist der Unterschied zwischen Modellen mit festen Effekten, zufälligen Effekten und gemischten Effekten?
Ich wäre auch dankbar, wenn mich jemand auf eine kurze (ca. 200 Seiten) Referenz zur gemischten Modellanalyse verweisen könnte. Um es hinzuzufügen, würde ich ungeachtet der Softwarebehandlung gemischte Modellierungsreferenzen bevorzugen. Hauptsächlich theoretische Erklärung der gemischten Modellierung.
Antworten:
Sowohl Paneldaten als auch Mixed-Effect-Modelldaten befassen sich mit doppelt indizierten Zufallsvariablenyij . Der erste Index ist für Gruppen, der zweite für Einzelpersonen innerhalb der Gruppe. Für die Paneldaten ist der zweite Index normalerweise die Zeit, und es wird angenommen, dass wir Individuen im Laufe der Zeit beobachten. Wenn die Zeit der zweite Index für ein Modell mit gemischten Effekten ist, werden die Modelle als longitudinale Modelle bezeichnet. Das Mixed-Effekt-Modell lässt sich am besten anhand von 2-Stufen-Regressionen verstehen. (Zur Vereinfachung der Darstellung wird nur eine erklärende Variable angenommen.)
Die Regression der ersten Ebene ist die folgende
Dies wird einfach als individuelle Regression für jede Gruppe erklärt. Die Regression der zweiten Ebene versucht, die Variation der Regressionskoeffizienten zu erklären:
Wenn Sie die zweite Gleichung durch die erste ersetzen, erhalten Sie
Die festen Effekte sind die festen, das heißt . Die zufälligen Effekte sind u i und v iγ0,γ1,δ0,δ1 ui vi .
Jetzt ändert sich die Terminologie für Paneldaten, aber Sie können immer noch Gemeinsamkeiten finden. Das Panel Data Random Effects-Modell ist dasselbe wie das Mixed Effects-Modell mit
β i = δ 0
mit dem Modell kommt
wo sind zufällige Effekte.ui
Der wichtigste Unterschied zwischen gemischten Effektmodellen und Paneldatenmodellen ist die Behandlung von Regressorenxij . Bei Modellen mit gemischten Effekten handelt es sich um nicht zufällige Variablen, während bei Paneldatenmodellen immer davon ausgegangen wird, dass sie zufällig sind. Dies wird wichtig, wenn angegeben wird, welches Effektmodell für Paneldaten festgelegt ist.
Für das Mischeffektmodell wird angenommen, dass die Zufallseffekte und v i unabhängig von ε i j und auch von x i j und z i sind , was immer dann zutrifft, wenn x i j und z i fest sind. Wenn wir stochastisches x i j zulassenui vi εij xij zi xij zi xij wird dies wichtig. Das Zufallseffektmodell für Paneldaten geht also davon aus, dass nicht mit u i korreliert ist . Aber das Festeffektmodell hat die gleiche Formxit ui
erlaubt die Korrelation von und u i . Die Betonung liegt dann ausschließlich auf der konsequenten Schätzung von δ 0 . Dies geschieht durch Subtraktion der einzelnen Mittelwerte:xit ui δ0
und Verwenden von einfachem OLS für das resultierende Regressionsproblem. Algebraisch fällt dies mit dem Problem der Variablenregression der kleinsten Quadrate zusammen, wobei angenommen wird, dass feste Parameter sind. Daher der Name Fixed Effects Model.ui
In der Paneldaten-Ökonometrie steckt viel Geschichte hinter der Terminologie für feste Effekte und zufällige Effekte, die ich weggelassen habe. Meiner persönlichen Meinung nach lassen sich diese Modelle am besten in Wooldridges " Ökonometrischer Analyse von Querschnitts- und Paneldaten " erklären . Soweit ich weiß, gibt es im Mixed-Effects-Modell keine solche Geschichte, aber ich komme aus der Ökonometrie, sodass ich mich irren könnte.
quelle
Sie suchen nach einem Text, der die Theorie der gemischten Modellierung ohne Bezugnahme auf ein Softwarepaket beschreibt.
Ich würde Multilevel Analysis, eine Einführung in die grundlegende und erweiterte Mehrebenenmodellierung von Tom Snijders und Roel Bosker, ca. 250 Seiten empfehlen. Am Ende befindet sich ein Kapitel über Software (das inzwischen etwas veraltet ist), der Rest ist jedoch eine sehr naheliegende Theorie.
Ich muss jedoch sagen, dass ich der obigen Empfehlung für mehrstufige und längsgerichtete Modelle mit Stata von Sophia Rabe-Hesketh und Anders Skrondal zustimme. Das Buch ist sehr theoretisch und die Software-Komponente ist wirklich nur eine schöne Ergänzung zu einem umfangreichen Text. Normalerweise verwende ich Stata nicht und habe den Text auf meinem Schreibtisch und finde ihn sehr gut geschrieben. Es ist jedoch viel länger als 200pp.
Die folgenden Texte wurden alle von aktuellen Experten auf diesem Gebiet verfasst und sind hilfreich für alle, die weitere Informationen zu diesen Techniken wünschen (obwohl sie nicht speziell auf Ihre Anfrage zugeschnitten sind): Benutzer, sorry]
Hoox, Joop (2010). Multilevel-Analyse, Techniken und Anwendungen.
Gelman, A. und Hill, J. (2006) Data Analysis Using Regression und Multilevel / Hierarchical Models.
Singer, J. (2003) Angewandte Längsschnittdatenanalyse: Modellierung von Veränderungen und Ereignisereignissen
Raudenbush, SW, und Bryk, A., S. (2002). Hierarchische lineare Modelle: Anwendungen und Datenanalysemethoden
Luke, Douglas, (2004). Mehrebenenmodellierung
Ich würde auch den oben erwähnten Wooldridge-Text sowie den R-Text an zweiter Stelle setzen, und das B ristol University Center for Multilevel Modeling verfügt über eine Reihe von Tutorials und Informationen
quelle
Ich habe mich auch über den Unterschied zwischen beiden gewundert und als ich kürzlich eine Referenz zu diesem Thema gefunden habe, verstehe ich, dass "Panel-Daten" ein traditioneller Name für Datensätze ist, die einen "Querschnitt oder eine Gruppe von Personen darstellen, die in regelmäßigen Abständen über a befragt werden gegebene Zeitspanne ". Das "Panel" ist also eine Gruppenstruktur innerhalb des Datensatzes, und bei einer solchen Gruppe erfolgt die Analyse dieser Art von Daten am natürlichsten über einen gemischten Modellierungsansatz.
Eine gute Referenz (unabhängig davon, ob Sie R "sprechen" oder nicht) zur Modellierung mit gemischten Effekten ist der Entwurf eines (?) Kommenden Buches von Douglas Bates ( lme4: Modellierung mit gemischten Effekten mit R) ).
quelle
@mpiktas hat eine gründliche Antwort gegeben. Ich würde auch vorschlagen, das Kapitel 7 der Dokumentation für plm package in R zu lesen . Die Diskussion der Autoren über den Unterschied zwischen gemischten Modellen und Paneldaten ist eine Lektüre wert.
quelle
Wenn Sie Stata-, Multilevel- und Longitudinalmodelle verwenden, ist die Verwendung von Stata von Sophia Rabe-Hesketh und Anders Skrondal eine gute Wahl. Je nachdem, was genau Sie interessiert, könnten 200 Seiten in etwa richtig sein.
quelle
Meiner Erfahrung nach liegt der Grund für die Verwendung der Panel-Ökonometrie darin, dass die Panel-Schätzer für „feste Effekte“ verwendet werden können, um verschiedene Formen der ausgelassenen variablen Verzerrung zu steuern.
Es ist jedoch möglich, diese Art der Schätzung in einem Mehrebenenmodell unter Verwendung eines Ansatzes vom Typ Mundlak durchzuführen , dh die Gruppenmittel als zusätzliche Regressoren einzubeziehen. Durch diesen Ansatz wird die Korrelation zwischen dem Fehlerterm und den ausgelassenen Faktoren auf potenzieller Gruppenebene aufgehoben, wodurch der Koeffizient „innerhalb“ aufgedeckt wird. Aus einem mir unbekannten Grund geschieht dies jedoch normalerweise nicht in der angewandten Forschung. Diese Folien und dieses Dokument bieten eine Ausarbeitung.
quelle