Ich habe mehrere Bücher durchgesehen (Raudenbush & Bryk, Snijders & Bosker, Gelman & Hill usw.) und mehrere Artikel (Gelman, Jusko, Primo & Jacobsmeier usw.), und ich habe meinen Kopf immer noch nicht richtig umwickelt Die Hauptunterschiede zwischen der Verwendung von gruppierten Standardfehlern und der Modellierung auf mehreren Ebenen.
Ich verstehe die Teile, die mit der vorliegenden Forschungsfrage zu tun haben; Es gibt bestimmte Arten von Antworten, die Sie nur bei der mehrstufigen Modellierung erhalten können. Was ist beispielsweise für ein zweistufiges Modell, bei dem Ihre interessierenden Koeffizienten nur auf der zweiten Ebene liegen, der Vorteil einer Methode gegenüber der anderen? In diesem Fall mache ich mir keine Sorgen über Vorhersagen oder das Extrahieren einzelner Koeffizienten für Cluster.
Der Hauptunterschied, den ich feststellen konnte, ist, dass Cluster-Standardfehler leiden, wenn Cluster ungleiche Stichprobengrößen aufweisen, und dass die Mehrebenenmodellierung insofern schwach ist, als sie eine Spezifikation der Zufallskoeffizientenverteilung voraussetzt (während die Verwendung von Cluster-Standardfehlern modellfrei ist). .
Und bedeutet dies letztendlich, dass wir für Modelle, die angeblich beide Methoden verwenden könnten, ähnliche Ergebnisse in Bezug auf Koeffizienten und Standardfehler erhalten sollten?
Alle Antworten oder hilfreiche Ressourcen würden sehr geschätzt.
Antworten:
Dieser Beitrag basiert auf persönlichen Erfahrungen, die möglicherweise spezifisch für meine Daten sind. Daher bin ich mir nicht sicher, ob er als Antwort geeignet ist.
Ich empfehle, wenn möglich Simulationen zu verwenden, um festzustellen, welche Methode für Ihre Daten am besten geeignet ist. Ich tat dies und war überrascht, als ich feststellte, dass Tests (bezüglich der Parameter in der ersten Ebene), die auf einer Mehrebenenmodellierung basierten, eine bessere Leistung ergaben als jede andere Methode, während die Größe selbst in kleinen Stichproben mit wenigen und ungleich großen "Clustern" beibehalten wurde. Ich muss noch ein Papier finden, das diesen Punkt verdeutlicht, und aus meiner Sicht ist dies kein Nischenthema und verdient mehr Aufmerksamkeit. Ich denke, es ist noch nicht ausreichend erforscht, wie verschiedene Methoden mit endlichen Stichproben oder wenigen / ungeraden Clustern verglichen werden.
quelle