Berechnung der Stichprobengröße für gemischte Modelle

23

Ich frage mich, ob es Methoden zur Berechnung der Stichprobengröße in gemischten Modellen gibt. Ich benutze lmerin R, um die Modelle anzupassen (ich habe zufällige Steigungen und Abschnitte).

Nikita Kuznetsov
quelle
3
Simulation ist immer eine Option - dh simulieren Sie Daten unter einer bestimmten alternativen Hypothese und Stichprobengröße und passen Sie das Modell mehrmals an, um festzustellen, wie oft Sie die interessierende Nullhypothese ablehnen. Nach meiner Erfahrung ist dies recht (Computer-) zeitaufwändig, da es für jede Modellanpassung mindestens einige Sekunden dauert.
Makro

Antworten:

29

Das longpowerPaket implementiert die Stichprobengrößenberechnungen von Liu und Liang (1997) und Diggle et al. (2002). Die Dokumentation enthält Beispielcode. Hier ist eine mit der lmmpower()Funktion:

> require(longpower)
> require(lme4)
> fm1 <- lmer(Reaction ~ Days + (Days|Subject), sleepstudy) 
> lmmpower(fm1, pct.change = 0.30, t = seq(0,9,1), power = 0.80)

     Power for longitudinal linear model with random slope (Edland, 2009) 

              n = 68.46972
          delta = 3.140186
         sig2.s = 35.07153
         sig2.e = 654.941
      sig.level = 0.05
              t = 0, 1, 2, 3, 4, 5, 6, 7, 8, 9
          power = 0.8
    alternative = two.sided
       delta.CI = 2.231288, 4.049084
           Days = 10.46729
        Days CI = 7.437625, 13.496947
           n.CI = 41.18089, 135.61202

Überprüfen Sie auch, liu.liang.linear.power()welches " die Stichprobengrößenberechnung für ein lineares gemischtes Modell durchführt".

Liu, G. & Liang, KY (1997). Stichprobengrößenberechnungen für Studien mit korrelierten Beobachtungen. Biometrics, 53 (3), 937 & ndash; 47.

Diggle PJ, Heagerty PJ, Liang K, Zeger SL. Analyse von Längsschnittdaten. Zweite Ausgabe. Oxford. Statistical Science Serires. 2002

Bearbeiten: Eine andere Möglichkeit besteht darin, den Effekt der Clusterbildung zu "korrigieren". In einem gewöhnlichen linearen Modell ist jede Beobachtung unabhängig, aber bei Vorhandensein von Clustern sind Beobachtungen nicht unabhängig, was als weniger unabhängige Beobachtungen angesehen werden kann - die effektive Stichprobengröße ist kleiner. Dieser Wirkungsverlust wird als Designeffekt bezeichnet :

DE=1+(m-1)ρ
mρDE
Robert Long
quelle
3
DEFF=1+(m1)ρxρϵ,
ρxρϵ
Können Sie mich auf ein Zitat für diese Formel hinweisen?
Joshua Rosenberg
10

Für alles, was über die einfachen 2 Stichproben-Tests hinausgeht, bevorzuge ich die Simulation für Stichprobengrößen- oder Leistungsstudien. Bei vorgefertigten Routinen können Sie manchmal große Unterschiede zwischen den Ergebnissen der Programme feststellen, die auf den getroffenen Annahmen beruhen (und Sie können möglicherweise nicht herausfinden, was diese Annahmen sind, geschweige denn, ob sie für Ihre Studie angemessen sind). Mit der Simulation steuern Sie alle Annahmen.

Hier ist ein Link zu einem Beispiel:
https://stat.ethz.ch/pipermail/r-sig-mixed-models/2009q1/001790.html

Greg Snow
quelle
Ich frage mich nur, funktioniert das auch bei GLMER-Modellen?
Charlie Glez
1
@CarlosGlez, ja, das funktioniert für jedes Modell, in dem Sie Daten simulieren und analysieren können. Ich habe das für GLMER-Modelle gemacht.
Greg Snow
Gut gesagt, und ich werde hinzufügen, dass Sie zusätzlich zu "Kontrollieren von Annahmen" auch "Was-wäre-wenn" -Fragen stellen, diese Annahmen brechen und ein gewisses praktisches Gefühl der Robustheit feststellen können, z.
AdamO