Clustered Standard Error vs. Mehrebenenmodellierung?

18

Ich habe mehrere Bücher durchgesehen (Raudenbush & Bryk, Snijders & Bosker, Gelman & Hill usw.) und mehrere Artikel (Gelman, Jusko, Primo & Jacobsmeier usw.), und ich habe meinen Kopf immer noch nicht richtig umwickelt Die Hauptunterschiede zwischen der Verwendung von gruppierten Standardfehlern und der Modellierung auf mehreren Ebenen.

Ich verstehe die Teile, die mit der vorliegenden Forschungsfrage zu tun haben; Es gibt bestimmte Arten von Antworten, die Sie nur bei der mehrstufigen Modellierung erhalten können. Was ist beispielsweise für ein zweistufiges Modell, bei dem Ihre interessierenden Koeffizienten nur auf der zweiten Ebene liegen, der Vorteil einer Methode gegenüber der anderen? In diesem Fall mache ich mir keine Sorgen über Vorhersagen oder das Extrahieren einzelner Koeffizienten für Cluster.

Der Hauptunterschied, den ich feststellen konnte, ist, dass Cluster-Standardfehler leiden, wenn Cluster ungleiche Stichprobengrößen aufweisen, und dass die Mehrebenenmodellierung insofern schwach ist, als sie eine Spezifikation der Zufallskoeffizientenverteilung voraussetzt (während die Verwendung von Cluster-Standardfehlern modellfrei ist). .

Und bedeutet dies letztendlich, dass wir für Modelle, die angeblich beide Methoden verwenden könnten, ähnliche Ergebnisse in Bezug auf Koeffizienten und Standardfehler erhalten sollten?

Alle Antworten oder hilfreiche Ressourcen würden sehr geschätzt.

RickyB
quelle
6
Benutzer Stask hat eine schöne Antwort auf genau diese Frage .
Andy W
Vielen Dank. Ich habe das schon einmal gelesen, was mich in Bezug auf die tatsächlichen Vorteile skeptischer machte. Die eigentliche Motivation für meine Frage ist jedoch zu sehen, ob ich überhaupt der Meinung bin, dass es nicht übermäßig nützlich ist, wenn ich nur die Koeffizienten der Ebene 2 als von Interesse betrachte. Vielleicht habe ich es auch verpasst, aber ich glaube nicht, dass in diesem Beitrag angesprochen wurde, ob diese beiden Methoden ähnliche Ergebnisse liefern sollten (wenn die Annahmen beider Methoden erfüllt sind).
RickyB
1
Mit "Koeffizienten auf der zweiten Ebene" meinen Sie die Ebene, auf der Sie die Parameter der ersten Stufe als abhängige Variablen haben?
Sheß
Ja, das meine ich.
RickyB

Antworten:

1

Dieser Beitrag basiert auf persönlichen Erfahrungen, die möglicherweise spezifisch für meine Daten sind. Daher bin ich mir nicht sicher, ob er als Antwort geeignet ist.

Ich empfehle, wenn möglich Simulationen zu verwenden, um festzustellen, welche Methode für Ihre Daten am besten geeignet ist. Ich tat dies und war überrascht, als ich feststellte, dass Tests (bezüglich der Parameter in der ersten Ebene), die auf einer Mehrebenenmodellierung basierten, eine bessere Leistung ergaben als jede andere Methode, während die Größe selbst in kleinen Stichproben mit wenigen und ungleich großen "Clustern" beibehalten wurde. Ich muss noch ein Papier finden, das diesen Punkt verdeutlicht, und aus meiner Sicht ist dies kein Nischenthema und verdient mehr Aufmerksamkeit. Ich denke, es ist noch nicht ausreichend erforscht, wie verschiedene Methoden mit endlichen Stichproben oder wenigen / ungeraden Clustern verglichen werden.

sheß
quelle
Danke für deinen Kommentar. Haben Sie zufällig ein Dokument, in dem Sie Ihre Ergebnisse aufgezeichnet haben? Ich wäre sehr daran interessiert, es anzusehen und zu sehen, was Sie gefunden haben (und natürlich würde ich es nicht zitieren, teilen oder verbessern, ohne es mit Ihnen zu diskutieren).
RickyB