Diese Frage mag dumm klingen, aber ... ist es richtig, dass zufällige Effekte nur für kategoriale Variablen gelten können (wie individuelle ID, Populations-ID, ...), z. B. ist eine kategoriale Variable:
~ β x i
~ N o r m ( μ , δ 2 )
aber nach dem Prinzip kann der Zufallseffekt nicht auf kontinuierliche Variablen (wie Höhe, Masse ...) angewendet werden , sagen wir :
~ α + β ⋅ z i
denn dann gibt es nur einen Koeffizienten der nicht eingeschränkt werden kann? Klingt logisch, aber ich frage mich, warum es in der statistischen Literatur nie erwähnt wird! Vielen Dank!
EDIT: Aber was ist, wenn ich wie z i ~ N o r m ( μ , δ 2 ) einschränke ? Ist es dann zufälliger Effekt? Dies unterscheidet sich jedoch von der Einschränkung, die ich auf β x i gesetzt habe - hier beschränke ich die Variable, während ich im vorherigen Beispiel den Koeffizienten eingeschränkt habe ! Es sieht für mich wie ein großes Durcheinander aus ... Wie auch immer, es macht nicht viel Sinn, diese Einschränkung zu setzen, weil z ich bekannte Werte bin, also ist diese Idee vielleicht völlig seltsam :-)
Antworten:
Dies ist eine gute und sehr grundlegende Frage.
Die Interpretation zufälliger Effekte ist sehr domänenspezifisch und hängt von der Wahl der Modellierung ab (dem statistischen Modell oder einem Bayesianer oder Frequentisten). Eine sehr gute Diskussion finden Sie auf Seite 245, Gelman and Hill (2007) . Für einen Bayesianer ist alles zufällig (obwohl Parameter einen echten festen Wert haben können, werden sie als zufällig modelliert), und ein Frequentist kann auch einen Parameterwert als festen Effekt auswählen, der sonst als zufällig modelliert worden wäre (siehe Casella, 2008 Diskussion über zu fixierende oder zufällige Blöcke in Beispiel 3.2).
Bearbeiten (nach Kommentar)
Daten werden repariert, nachdem Sie sie beobachtet haben. Wenn sie kontinuierlich sind, sollten sie als kontinuierlich modelliert werden. Sie können kategoriale Variablen als kategorial und manchmal als kontinuierlich modellieren (wie in einer Ordnungsvariableneinstellung). Die Parameter sind unbekannt und können als fest oder zufällig modelliert werden. Die Parameter beziehen sich im Wesentlichen auf die Reaktion auf Prädiktoren. Wenn Sie möchten, dass die Steigung des einzelnen Prädiktors (oder sein Koeffizient in einem linearen Modell) für jede Antwort variiert, modellieren Sie sie als zufällig, andernfalls als fest. Wenn Sie möchten, dass der Achsenabschnitt in Bezug auf Gruppen variiert, sollten diese ebenfalls als zufällig modelliert werden. Andernfalls sollten sie behoben werden.
quelle
Ihre Frage wurde möglicherweise bereits gelöst, aber sie ist tatsächlich in einem Lehrbuch geschrieben.
auf Seite 232 von: Alan Grafen und Rosie Hails (2002) "Moderne Statistik für die Biowissenschaften", Oxford University Press.
quelle
Ich denke, das Problem ist, dass es hier zwei Dinge gibt. Ein typisches Beispiel für zufällige Effekte könnte die Vorhersage des Notendurchschnitts (GPA) eines College-Studenten auf der Grundlage einer Reihe von Faktoren sein, einschließlich seiner durchschnittlichen Punktzahl in einer Reihe von Tests während der High School.
Die durchschnittliche Punktzahl ist kontinuierlich . Normalerweise haben Sie einen unterschiedlichen Schnittpunkt oder Schnittpunkt und eine unterschiedliche Steigung für die durchschnittliche Punktzahl für jede Person. Das Individuum ist offensichtlich kategorisch .
Wenn Sie also sagen "gilt nur für kategoriale Variablen", ist dies etwas vage. Angenommen, Sie berücksichtigen nur einen zufälligen Abschnitt für die durchschnittliche Punktzahl. In diesem Fall wird Ihr zufälliger Achsenabschnitt für eine kontinuierliche Größe wahrscheinlich tatsächlich als eine Art Gaußsche Variable mit einem Mittelwert und einer Standardabweichung modelliert, die durch das Verfahren bestimmt werden. Dieser zufällige Abschnitt wird jedoch für eine Population von Schülern bestimmt, wobei jeder Schüler durch eine kategoriale Variable identifiziert wird.
Sie können anstelle des Studentenausweises eine "kontinuierliche" Variable verwenden. Vielleicht könnten Sie die Größe eines Schülers wählen. Aber es müsste im Wesentlichen so behandelt werden, als wäre es kategorisch. Wenn Ihre Höhenmessungen sehr genau wären, würden Sie wieder eine eindeutige Größe für jeden Schüler erhalten, was nichts anderes bewirkt hätte. Wenn Ihre Höhenmessungen nicht sehr genau wären, würden Sie am Ende mehrere Schüler in jeder Höhe zusammenfassen. (Mischen ihrer Punktzahlen auf möglicherweise schlecht definierte Weise.)
Dies ist das Gegenteil von Interaktionen. In einer Interaktion multiplizieren Sie zwei Variablen und behandeln beide im Wesentlichen als kontinuierlich. Eine kategoriale Variable würde in einen Satz von 0/1 Dummy-Variablen aufgeteilt und die 0 oder 1 würde mit der anderen Variablen in der Interaktion multipliziert.
Die Quintessenz ist, dass ein "zufälliger Effekt" in gewissem Sinne nur ein Koeffizient ist, der eher eine Verteilung (modelliert) als einen festen Wert hat.
quelle