In einem Modell mit gemischten Effekten wird empfohlen, einen Parameter anhand eines festen Effekts zu schätzen, wenn alle möglichen Werte enthalten sind (z. B. sowohl Männer als auch Frauen). Es wird weiterhin empfohlen, einen Zufallseffekt zu verwenden, um eine Variable zu berücksichtigen, wenn die enthaltenen Werte nur eine Zufallsstichprobe aus einer Population sind (eingeschriebene Patienten aus dem Universum möglicher Patienten) und Sie den Populationsmittelwert und die Varianz anstelle der Mittelwerte schätzen möchten der einzelnen Faktorstufen.
Ich frage mich, ob Sie logischerweise verpflichtet sind, immer einen festen Effekt auf diese Weise zu verwenden. Betrachten Sie eine Studie darüber, wie sich die Größe des Fußes / Schuhs im Laufe der Entwicklung ändert und beispielsweise mit Größe, Gewicht und Alter zusammenhängt. Es muss eindeutig in das Modell aufgenommen werden, um die Tatsache zu berücksichtigen, dass die Messungen über die Jahre in einem bestimmten Fuß verschachtelt und nicht unabhängig sind. Darüber hinaus sind rechts und links alle Möglichkeiten, die existieren können. Darüber hinaus kann es sehr wahr sein, dass für einen bestimmten Teilnehmer sein rechter Fuß größer (oder kleiner) als sein linker ist. Obwohl sich die Fußgröße bei allen Menschen etwas zwischen den Füßen unterscheidet, gibt es keinen Grund zu der Annahme, dass die rechten Füße im Durchschnitt größer sind als die linken Füße. Wenn sie sich in Ihrer Stichprobe befinden, liegt dies vermutlich eher an der Genetik der Personen in Ihrer Stichprobe als an etwas, das für die Rechtschaffenheit von Bedeutung ist. Schließlich scheint ein Störparameter zu sein, der Sie nicht wirklich interessiert.
Lassen Sie mich feststellen, dass ich dieses Beispiel erfunden habe. Es kann nicht gut sein; es ist nur um die Idee zu vermitteln. Nach allem, was ich weiß, war ein großer rechter und ein kleiner linker Fuß notwendig, um im Paläolithikum zu überleben.
Wäre es in einem solchen Fall (mehr / weniger / überhaupt) sinnvoll, als Zufallseffekt in das Modell einzubeziehen? Was wäre das Für und Wider, wenn man hier einen festen oder zufälligen Effekt verwenden würde?
quelle
Antworten:
Das allgemeine Problem bei "festen" und "zufälligen" Effekten besteht darin, dass sie nicht einheitlich definiert sind. Andrew Gelman zitiert einige von ihnen:
und bemerkt, dass sie nicht konsistent sind. In seinem Buch Data Analysis Using Regression und Multilevel / Hierarchical Models vermeidet er im Allgemeinen die Verwendung dieser Begriffe und konzentriert sich in seiner Arbeit auf feste oder zwischen Gruppen variierende Abschnitte und Steigungen, weil
Dies gilt insbesondere für das Bayes'sche Gerüst, das üblicherweise für gemischte Modelle verwendet wird, bei denen alle Effekte per se zufällig sind. Wenn Sie an Bayes denken, sind Sie nicht wirklich mit "festen" Effekten und Punktschätzungen beschäftigt und haben kein Problem damit, alle Effekte als zufällig zu behandeln.
Je mehr ich zu diesem Thema lese, desto mehr bin ich davon überzeugt, dass es sich eher um eine ideologische Diskussion darüber handelt, was wir einschätzen können (oder sollten) und was wir nur vorhersagen können (hier könnte ich auch auf Ihre eigene Antwort verweisen ). Sie verwenden Zufallseffekte, wenn Sie eine Zufallsstichprobe möglicher Ergebnisse haben, sodass Sie sich nicht um individuelle Schätzungen kümmern und sich eher um die Bevölkerungseffekte als um Einzelpersonen. Die Beantwortung Ihrer Frage hängt also auch davon ab, was Sie denken, wenn Sie die festen Auswirkungen Ihrer Daten abschätzen möchten oder können . Wenn alle möglichen Ebenen in Ihren Daten enthalten sind, können SieFeste Effekte abschätzen - auch wie in Ihrem Beispiel könnte die Anzahl der Ebenen gering sein, und das wäre im Allgemeinen nicht gut für die Schätzung von zufälligen Effekten, und es gibt einige Mindestanforderungen dafür .
Argument für das beste Szenario
Angenommen, Sie haben unbegrenzte Datenmengen und unbegrenzte Rechenleistung. In diesem Fall können Sie sich vorstellen, jeden Effekt als fix einzuschätzen, da fixe Effekte Ihnen mehr Flexibilität bieten (damit wir die einzelnen Effekte vergleichen können). Aber selbst in diesem Fall würden die meisten von uns nur ungern feste Effekte für alles verwenden.
Stellen Sie sich beispielsweise vor, Sie möchten die Prüfungsergebnisse von Schulen in einer Region modellieren und verfügen über Daten zu allen 100 Schulen in der Region. In diesem Fall könnten Sie Bedrohung Schulen als Fest - da Sie Daten auf allen Ebenen haben - aber in der Praxis würde man wohl eher denken an sie als zufällig. Warum das?
Ein Grund dafür ist, dass Sie in der Regel in solchen Fällen nicht an den Auswirkungen einzelner Schulen interessiert sind (und es ist schwierig, alle zu vergleichen), sondern an einer allgemeinen Variabilität zwischen den Schulen.
Ein weiteres Argument hier ist vorbildliche Sparsamkeit. Im Allgemeinen sind Sie nicht an "jedem möglichen Einfluss" -Modell interessiert, daher enthalten Sie in Ihrem Modell einige feste Effekte, die Sie testen und auf die anderen möglichen Variabilitätsquellen hin kontrollieren möchten. Dadurch passen Modelle mit gemischten Effekten in die allgemeine Denkweise der statistischen Modellierung, in der Sie etwas schätzen und für andere Dinge steuern. Bei komplizierten (mehrstufigen oder hierarchischen) Daten müssen Sie viele Effekte einbeziehen, sodass Sie einige als "fest" und andere als "zufällig" androhen, um sie zu kontrollieren.
In diesem Szenario würden Sie auch nicht davon ausgehen, dass jede Schule ihren eigenen, einzigartigen Einfluss auf die Ergebnisse hat, sondern eher, dass die Schulen im Allgemeinen einen gewissen Einfluss haben. Dieses Argument wäre also, dass wir der Meinung sind, dass es nicht wirklich möglich ist, die einzigartigen Auswirkungen einzelner Schulen abzuschätzen, und dass wir sie daher als zufällige Stichprobe möglicher Schuleffekte bedrohen.
Modelle mit gemischten Effekten liegen irgendwo zwischen "alles fest" und "alles zufällig". Die Daten, auf die wir stoßen, führen dazu, dass wir unsere Erwartungen hinsichtlich der Schätzung aller Effekte als festgelegte Effekte senken. Daher entscheiden wir, welche Effekte wir vergleichen und welche Effekte wir steuern möchten, oder ob wir ein allgemeines Gefühl für deren Einfluss haben. Es geht nicht nur darum, was die Daten sind, sondern auch darum, wie wir die Daten während der Modellierung betrachten.
quelle
Zusammenfassung
Es wird in der Tat oft gesagt, dass, wenn alle möglichen Faktorstufen in einem gemischten Modell enthalten sind, dieser Faktor als fester Effekt behandelt werden sollte. Dies gilt nicht unbedingt AUS ZWEI EINZIGARTIGEN GRÜNDEN:
(1) Wenn die Anzahl der Ebenen groß ist, kann es sinnvoll sein, den [gekreuzten] Faktor als zufällig zu behandeln.
Ich stimme hier sowohl mit @Tim als auch mit @RobertLong überein: Wenn ein Faktor eine große Anzahl von Ebenen hat, die alle in das Modell einbezogen sind (wie z. B. alle Länder der Welt; oder alle Schulen in einem Land; oder vielleicht die gesamte Bevölkerung von Probanden werden befragt, usw.), dann ist nichts falsch daran, sie als zufällig zu behandeln - dies könnte sparsamer sein, könnte zu einer gewissen Schrumpfung führen, usw.
(2) Wenn der Faktor in einem anderen zufälligen Effekt verschachtelt ist, muss er unabhängig von der Anzahl der Ebenen als zufällig behandelt werden.
In diesem Thread gab es eine große Verwirrung (siehe Kommentare), da sich andere Antworten auf den obigen Fall Nr. 1 beziehen, aber das Beispiel, das Sie gegeben haben, ist ein Beispiel für eine andere Situation, nämlich diesen Fall Nr. 2. Hier gibt es nur zwei Ebenen (dh überhaupt nicht "eine große Zahl"!) Und sie erschöpfen alle Möglichkeiten, aber sie sind in einem anderen Zufallseffekt verschachtelt, was zu einem verschachtelten Zufallseffekt führt.
Detaillierte Diskussion Ihres Beispiels
Seiten und Themen in Ihrem imaginären Experiment sind wie Klassen und Schulen im Standardbeispiel für hierarchische Modelle verwandt. Vielleicht hat jede Schule (Nr. 1, Nr. 2, Nr. 3 usw.) Klasse A und Klasse B, und diese beiden Klassen sollten ungefähr gleich sein. Sie werden die Klassen A und B nicht als festen Effekt mit zwei Ebenen modellieren. Das wäre ein Fehler. Sie werden die Klassen A und B jedoch auch nicht als "getrennten" (dh gekreuzten) Zufallseffekt mit zwei Ebenen modellieren. Das wäre auch ein Fehler. Stattdessen modellieren Sie Klassen als verschachtelten Zufallseffekt in Schulen.
Siehe hier: Gekreuzte versus verschachtelte zufällige Effekte: Wie unterscheiden sie sich und wie werden sie in lme4 korrekt angegeben?
Wie Sie selbst geschrieben haben, "gibt es keinen Grund zu der Annahme, dass die rechten Füße im Durchschnitt größer sind als die linken Füße". Es sollte also überhaupt keinen "globalen" Effekt (weder fest noch zufällig gekreuzt) des rechten oder linken Fußes geben. Stattdessen kann man sich vorstellen, dass jedes Subjekt "einen" Fuß und "einen anderen" Fuß hat, und diese Variabilität sollten wir in das Modell einbeziehen. Diese "einen" und "anderen" Füße sind in Subjekten verschachtelt, daher verschachtelte zufällige Effekte.
Weitere Details in Antwort auf die Kommentare. [26. September]
In meinem obigen Modell ist Side als verschachtelter Zufallseffekt in Subjects enthalten. Hier ist ein alternatives Modell, vorgeschlagen von @Robert, bei dem Side ein fester Effekt ist:
Es kann nicht.
Gleiches gilt für @ gungs hypothetisches Modell mit Side als gekreuztem Zufallseffekt:
Abhängigkeiten werden nicht berücksichtigt.
Demonstration über eine Simulation [2. Oktober]
Hier ist eine direkte Demonstration in R.
Ich erstelle einen Spielzeugdatensatz mit fünf Probanden, die fünf Jahre lang an beiden Füßen gemessen wurden. Der Effekt des Alters ist linear. Jedes Subjekt hat einen zufälligen Schnittpunkt. Und jedes Motiv hat einen Fuß (entweder den linken oder den rechten), der größer ist als der andere.
Entschuldigung für meine schrecklichen R-Fähigkeiten. So sehen die Daten aus (jeweils fünf aufeinanderfolgende Punkte entsprechen einem Fuß einer Person im Laufe der Jahre; jeweils zehn aufeinanderfolgende Punkte entsprechen zwei Fuß derselben Person):
Jetzt können wir eine Reihe von Modellen passen:
Alle Modelle enthalten einen festen Effekt von
age
und einen zufälligen Effekt vonsubject
, werden jedochside
unterschiedlich behandelt .side
age
side
age
side
age
Dies zeigt deutlich, dass
side
dies als verschachtelter Zufallseffekt behandelt werden sollte.Schließlich schlug @Robert in den Kommentaren vor, den globalen Effekt von
side
als Steuervariable aufzunehmen . Wir können es tun, während wir den verschachtelten Zufallseffekt beibehalten:side
side
quelle
side
eine der üblichen Definitionen / Richtlinien erfüllt ist, wann ein Faktor als zufällig oder fest zu behandeln ist. Insbesondere ist es bedeutungslos, Schlussfolgerungen über die abgetasteten Werte des Faktors hinaus zu ziehen. Darüber hinaus scheint es bei nur zwei Ebenen des Faktors eine eindeutige und unkomplizierte Möglichkeit zu sein, sich der Modellierung zu nähern.side
als Fest Effekt bedeutet , dass eine der Seiten (zB rechts) unter der Annahme , ist immer größer als die andere (links), um einen bestimmten Betrag. Dieser Betrag ist für alle Personen gleich. Dies ist ausdrücklich nicht das, was das OP im Sinn hatte. Er schrieb, dass bei manchen Menschen die Rechte größer sein könnte und bei anderen die Linke. Wir müssen jedoch dieside
korrelierten Fehler berücksichtigen . Warum können wir dann nicht als verschachtelten Zufallseffekt behandeln? Es ist genau wie Unterricht in Schulen.So ergänzen Sie die anderen Antworten:
Ich glaube nicht, dass Sie logischerweise verpflichtet sind, immer einen festen Effekt in der im OP beschriebenen Weise zu verwenden. Selbst wenn die üblichen Definitionen / Richtlinien für die Behandlung eines Faktors als zufällig nicht eingehalten werden, kann es sein, dass ich ihn bei einer großen Anzahl von Ebenen immer noch als zufällig modelliere, so dass die Behandlung des Faktors als feststehend viele Stufen verbrauchen würde Freiheit und führen zu einem umständlichen und weniger sparsamen Modell.
quelle
side
Effekt entweder als festen oder als gekreuzten Zufallseffekt behandeln, müssen Sie davon ausgehen, dass eine der Seiten (z. B. rechts) für alle Motive immer größer ist als die andere (links). Dies ist ausdrücklich nicht das, was Gung in seinem OP geschrieben hat, in dem es heißt, dass "kein Grund zu der Annahme besteht, dass die rechten Füße im Durchschnitt größer sind als die linken Füße". Ich sehe Gungs Beispiel immer noch als klaren Fall für verschachtelten Zufallseffekt, in völliger Analogie zu Klassen innerhalb der Schulen.Wenn Sie über die Situation sprechen, in der Sie alle möglichen Ebenen eines interessierenden Faktors kennen und über Daten zur Abschätzung der Auswirkungen verfügen, müssen Sie auf keinen Fall Ebenen mit zufälligen Effekten darstellen.
Der Grund, warum Sie einem Faktor einen zufälligen Effekt zuweisen möchten, besteht darin, dass Sie Rückschlüsse auf die Auswirkungen aller Ebenen dieses Faktors ziehen möchten, die normalerweise nicht bekannt sind. Um eine solche Schlussfolgerung zu ziehen, unterstellen Sie die Annahme, dass die Auswirkungen aller Ebenen im Allgemeinen eine Normalverteilung bilden. Aufgrund Ihrer Problemstellung können Sie die Auswirkungen aller Ebenen abschätzen. Dann ist es sicherlich nicht erforderlich, zufällige Effekte festzulegen und zusätzliche Annahmen zu treffen.
Es ist wie in der Situation, dass Sie in der Lage sind, alle Werte der Grundgesamtheit abzurufen (Sie kennen also den wahren Mittelwert), aber Sie versuchen, der Grundgesamtheit eine große Stichprobe zu entnehmen und dann den zentralen Grenzwertsatz zu verwenden, um die Stichprobenverteilung zu approximieren Schliessen Sie auf den wahren Mittelwert.
quelle