Was würde ein Konfidenzintervall um einen vorhergesagten Wert aus einem Mischeffektmodell bedeuten?

14

Ich habe diese Seite angesehenund bemerkte die Methoden für Konfidenzintervalle für lme und lmer in R. Für diejenigen, die R nicht kennen, sind dies Funktionen zum Erzeugen gemischter Effekte oder mehrstufiger Modelle. Wenn ich feste Effekte in so etwas wie einem Entwurf mit wiederholten Messungen habe, was würde ein Konfidenzintervall um den vorhergesagten Wert (ähnlich dem Mittelwert) bedeuten? Ich kann verstehen, dass Sie für einen Effekt ein angemessenes Konfidenzintervall haben können, aber es scheint mir, dass ein Konfidenzintervall um einen vorhergesagten Mittelwert in solchen Entwürfen unmöglich zu sein scheint. Es könnte entweder sehr groß sein, um die Tatsache anzuerkennen, dass die Zufallsvariable zur Unsicherheit in der Schätzung beiträgt, aber in diesem Fall wäre es in einem inferentiellen Sinn, Werte zu vergleichen, überhaupt nicht nützlich. Oder,

Vermisse ich hier etwas oder ist meine Analyse der Situation korrekt? ... [und wahrscheinlich eine Rechtfertigung dafür, warum es nicht in lmer implementiert ist (aber leicht in SAS zu bekommen ist). :)]

John
quelle
Da die Verschachtelung in einem Film im Wesentlichen ein Design für wiederholte Messungen darstellt, hat Ihre Frage nach dem geeigneten Konfidenzintervall für die Effektgröße einen Bezug zur Frage in ANOVA für wiederholte Messungen, über welches Maß für die Effektgröße berichtet werden soll. Insbesondere ist unklar, ob der Fehlerbegriff die Subjektvarianz umfassen soll oder nicht (usw.).
Russellpierce
Nevermind - das habe ich nicht durchgedacht.
russellpierce

Antworten:

6

Es hat dieselbe Bedeutung wie jedes andere Konfidenzintervall: Unter der Annahme, dass das Modell korrekt ist, liegt der wahre Wert der interessierenden Menge in 95% der Fälle innerhalb des Intervalls, wenn das Experiment und die Prozedur wiederholt werden. In diesem Fall ist die interessierende Größe der erwartete Wert der Antwortvariablen.

Es ist wahrscheinlich am einfachsten, dies im Kontext eines linearen Modells zu erklären (gemischte Modelle sind nur eine Erweiterung davon, daher gelten dieselben Ideen):

Die übliche Annahme ist, dass:

yi=Xi1β1+Xi2β2+Xichpβp+ϵ

wobei die Antwort ist, X i j die Kovariaten sind, β j die Parameter sind und ϵ der Fehlerterm ist, der den Mittelwert Null hat. Die Menge des Interesses ist dann:yichXichjβjϵ

E[yi]=Xi1β1+Xi2β2+Xipβp

Dies ist eine lineare Funktion der (unbekannten) Parameter, da die Kovariaten bekannt (und fest) sind. Da wir die Stichprobenverteilung des Parametervektors kennen, können wir die Stichprobenverteilung (und damit das Konfidenzintervall) dieser Größe leicht berechnen.

Warum solltest du es wissen wollen? Ich vermute, wenn Sie eine Vorhersage außerhalb der Stichprobe durchführen, kann dies Aufschluss darüber geben, wie gut Ihre Vorhersage voraussichtlich sein wird (obwohl Sie die Unsicherheit des Modells berücksichtigen müssen).

Simon Byrne
quelle
Das ist mein zweites Szenario, das Konfidenzintervall ist zu groß, um irgendeinen Inferenzwert innerhalb des Versuchsentwurfs zu haben, da die Unterschiede zwischen den Bedingungen auf Effekten beruhen, bei denen die Variabilität zwischen S beseitigt ist. Es scheint, dass es immer eine Kompromissbedeutung hat und einen eigenen speziellen Namen benötigt, da Sie es nicht wie ein reguläres CI verwenden können.
John
Blouin & Riopelle (2005) nannten sie enge und breite Inferenz-Konfidenzintervalle, aber angesichts der Tatsache, dass es der allgemeinen wissenschaftlichen Bevölkerung außerhalb der Statistiken schwer genug fällt, mit regulären Konfidenzintervallen klarzukommen ...
John
1

(yichj|μich)N(μich,σw2),μichN(μ,σb2),
und eine vorherige Verteilung auf den Gesamtmittelwert μ und die Varianzkomponenten σw2 und σb2. Dann jederμich hat eine hintere Verteilung und a 95% Das Dispersionsintervall dieser Verteilung könnte die Rolle von a spielen 95% "Konfidenz" -Intervall.
Stéphane Laurent
quelle