Können zufällige Effekte nur für kategoriale Variablen gelten?

9

Diese Frage mag dumm klingen, aber ... ist es richtig, dass zufällige Effekte nur für kategoriale Variablen gelten können (wie individuelle ID, Populations-ID, ...), z. B. ist eine kategoriale Variable:xi

~ β x iyiβxi

~ N o r m ( μ , δ 2 )βxiNorm(μ,δ2)

aber nach dem Prinzip kann der Zufallseffekt nicht auf kontinuierliche Variablen (wie Höhe, Masse ...) angewendet werden , sagen wir :zi

~ α + β z iyiα+βzi

denn dann gibt es nur einen Koeffizienten der nicht eingeschränkt werden kann? Klingt logisch, aber ich frage mich, warum es in der statistischen Literatur nie erwähnt wird! Vielen Dank!β

EDIT: Aber was ist, wenn ich wie z i ~ N o r m ( μ , δ 2 ) einschränke ? Ist es dann zufälliger Effekt? Dies unterscheidet sich jedoch von der Einschränkung, die ich auf β x i gesetzt habe - hier beschränke ich die Variable, während ich im vorherigen Beispiel den Koeffizienten eingeschränkt habe ! Es sieht für mich wie ein großes Durcheinander aus ... Wie auch immer, es macht nicht viel Sinn, diese Einschränkung zu setzen, weil z ich bekannte Werte bin, also ist diese Idee vielleicht völlig seltsam :-)ziziNorm(μ,δ2)βxizi

Neugierig
quelle
1
Interessante verwandte Frage: stats.stackexchange.com/q/61531/5509
Neugierig

Antworten:

5

Dies ist eine gute und sehr grundlegende Frage.

Die Interpretation zufälliger Effekte ist sehr domänenspezifisch und hängt von der Wahl der Modellierung ab (dem statistischen Modell oder einem Bayesianer oder Frequentisten). Eine sehr gute Diskussion finden Sie auf Seite 245, Gelman and Hill (2007) . Für einen Bayesianer ist alles zufällig (obwohl Parameter einen echten festen Wert haben können, werden sie als zufällig modelliert), und ein Frequentist kann auch einen Parameterwert als festen Effekt auswählen, der sonst als zufällig modelliert worden wäre (siehe Casella, 2008 Diskussion über zu fixierende oder zufällige Blöcke in Beispiel 3.2).

Bearbeiten (nach Kommentar)

Daten werden repariert, nachdem Sie sie beobachtet haben. Wenn sie kontinuierlich sind, sollten sie als kontinuierlich modelliert werden. Sie können kategoriale Variablen als kategorial und manchmal als kontinuierlich modellieren (wie in einer Ordnungsvariableneinstellung). Die Parameter sind unbekannt und können als fest oder zufällig modelliert werden. Die Parameter beziehen sich im Wesentlichen auf die Reaktion auf Prädiktoren. Wenn Sie möchten, dass die Steigung des einzelnen Prädiktors (oder sein Koeffizient in einem linearen Modell) für jede Antwort variiert, modellieren Sie sie als zufällig, andernfalls als fest. Wenn Sie möchten, dass der Achsenabschnitt in Bezug auf Gruppen variiert, sollten diese ebenfalls als zufällig modelliert werden. Andernfalls sollten sie behoben werden.

Suncoolsu
quelle
1
Danke für deine Antwort, aber hmmm ... Ich habe eine einfache Frage gestellt und irgendwie eine einfache oder allgemeine Antwort erwartet :) In deinem zweiten Absatz sagst du, dass auf Bayesianisch alles zufällig ist. Bitte komplizieren Sie es nicht zu sehr :) Ich habe absichtlich auf Modellebene gefragt, bitte vergessen Sie Frequentist oder Bayesian - ich interessiere mich für das Prinzip - für welche Art von Variablen werden die zufälligen Effekte normalerweise verwendet?
Neugierig
Im dritten Absatz stellen Sie eine spezielle Anwendung mit Zeitreihen vor. Ich bin mir nicht sicher, ob ich das verstehe, aber AFAIK-Zeitreihen sind normalerweise diskret (nicht kontinuierlich), wenn Sie über serielle Korrelation sprechen ... Wie auch immer, wenn Sie etwas allgemeineres haben antworte, bitte teile. Nochmals vielen Dank für die Antwort!
Neugierig
Die Zufälligkeit liegt in unbekannten Dingen. Wenn Sie Beobachtungen haben, sind sie bekannt! Das einzige, was Sie wissen, sind Ihre Daten. Die Unbekannten sind die Parameter und können als zufällig oder fest modelliert werden. (Entschuldigung für die Verwirrung; ich stimme zu, ich habe die Dinge unnötig kompliziert gemacht.)
suncoolsu
Vielen Dank für die Vereinfachung Ihrer Antwort. Ich komme also meiner Frage auf den Grund - das bedeutet also, dass die Antwort ja lautet , dh die zufälligen Effekte gelten nur für kategoriale Variablen, da die zufälligen Effekte nur für Parameter (keine Daten) gelten und die einzigen Parameter, die modelliert werden können Wie zufällig sind diejenigen mit mehreren Ebenen, dh diejenigen einer kategorialen Variablen? Und die Parameter kontinuierlicher Variablen können nicht als zufällig modelliert werden, da es nur 1 Parameterwert für kontinuierliche Variablen gibt? Vielen Dank!
Neugierig
In Ihrer spezifischen Einstellung lautet die Antwort JA . Aber im Allgemeinen lautet die Antwort, würde ich sagen, NEIN, da kontinuierliche Variablen je nach Gruppe variieren können. Zum Beispiel sollte das Einkommen der Einwohner der Stadt höher sein als das des Dorfes (Ihrer Meinung nach könnten dies zwei separate kategoriale Variablen für den Standort sein).
Suncoolsu
3

Ihre Frage wurde möglicherweise bereits gelöst, aber sie ist tatsächlich in einem Lehrbuch geschrieben.

Zufällige Effekte sind kategoriale Variablen, deren Niveaus als Stichprobe einer größeren Population angesehen werden, im Gegensatz zu festen Effekten, deren Niveaus für sich genommen von Interesse sind.

auf Seite 232 von: Alan Grafen und Rosie Hails (2002) "Moderne Statistik für die Biowissenschaften", Oxford University Press.

Sapporo
quelle
2
Das ist alles wahr, aber ich denke nicht, dass dies die Frage beantwortet.
Patrick Coulombe
1
Ich bin mit dem obigen Kommentar von @PatrickCoulombe nicht einverstanden, ich denke, dies beantwortet genau die Frage. +1.
Amöbe
1

Ich denke, das Problem ist, dass es hier zwei Dinge gibt. Ein typisches Beispiel für zufällige Effekte könnte die Vorhersage des Notendurchschnitts (GPA) eines College-Studenten auf der Grundlage einer Reihe von Faktoren sein, einschließlich seiner durchschnittlichen Punktzahl in einer Reihe von Tests während der High School.

Die durchschnittliche Punktzahl ist kontinuierlich . Normalerweise haben Sie einen unterschiedlichen Schnittpunkt oder Schnittpunkt und eine unterschiedliche Steigung für die durchschnittliche Punktzahl für jede Person. Das Individuum ist offensichtlich kategorisch .

Wenn Sie also sagen "gilt nur für kategoriale Variablen", ist dies etwas vage. Angenommen, Sie berücksichtigen nur einen zufälligen Abschnitt für die durchschnittliche Punktzahl. In diesem Fall wird Ihr zufälliger Achsenabschnitt für eine kontinuierliche Größe wahrscheinlich tatsächlich als eine Art Gaußsche Variable mit einem Mittelwert und einer Standardabweichung modelliert, die durch das Verfahren bestimmt werden. Dieser zufällige Abschnitt wird jedoch für eine Population von Schülern bestimmt, wobei jeder Schüler durch eine kategoriale Variable identifiziert wird.

Sie können anstelle des Studentenausweises eine "kontinuierliche" Variable verwenden. Vielleicht könnten Sie die Größe eines Schülers wählen. Aber es müsste im Wesentlichen so behandelt werden, als wäre es kategorisch. Wenn Ihre Höhenmessungen sehr genau wären, würden Sie wieder eine eindeutige Größe für jeden Schüler erhalten, was nichts anderes bewirkt hätte. Wenn Ihre Höhenmessungen nicht sehr genau wären, würden Sie am Ende mehrere Schüler in jeder Höhe zusammenfassen. (Mischen ihrer Punktzahlen auf möglicherweise schlecht definierte Weise.)

Dies ist das Gegenteil von Interaktionen. In einer Interaktion multiplizieren Sie zwei Variablen und behandeln beide im Wesentlichen als kontinuierlich. Eine kategoriale Variable würde in einen Satz von 0/1 Dummy-Variablen aufgeteilt und die 0 oder 1 würde mit der anderen Variablen in der Interaktion multipliziert.

Die Quintessenz ist, dass ein "zufälliger Effekt" in gewissem Sinne nur ein Koeffizient ist, der eher eine Verteilung (modelliert) als einen festen Wert hat.

Wayne
quelle
Bitte melden Sie sich unter Ihrem Hauptkonto an, um bearbeiten zu können.
Amöbe