Sollte der Unterschied zwischen Kontrolle und Behandlung explizit oder implizit modelliert werden?

9

Bei folgendem Versuchsaufbau:

Von einem Probanden werden mehrere Proben entnommen und jede Probe wird auf verschiedene Arten behandelt (einschließlich einer Kontrollbehandlung). Was hauptsächlich interessant ist, ist der Unterschied zwischen der Kontrolle und jeder Behandlung.

Ich kann mir zwei einfache Modelle für diese Daten vorstellen. Wenn Probe , Behandlung j , Behandlung 0 die Kontrolle ist, sei Y i j die Daten, γ i die Basislinie für Probe i , δ j die Differenz für Behandlung j . Das erste Modell befasst sich sowohl mit der Steuerung als auch mit dem Unterschied:ijYijγiiδjj

δ 0 = 0

Yij=γi+δj+ϵij
δ0=0

Während das zweite Modell nur den Unterschied betrachtet. Wenn wir vorberechnen vorher d i j = Y i j - Y i 0 dann d i j = δ j + ε i jdij

dij=YijYi0
dij=δj+εij

Meine Frage ist, was sind die grundlegenden Unterschiede zwischen diesen beiden Setups? Insbesondere wenn die Ebenen an sich bedeutungslos sind und nur der Unterschied von Bedeutung ist, macht das erste Modell zu viel und ist möglicherweise unterfordert?

Rónán Daly
quelle
2
Ich kann später eine gründlichere Antwort geben, aber ich würde vorschlagen, dass dieses Papier von Paul Allison von Interesse ist ( Allison, 1990 ).
Andy W
1
Bearbeitet, um die Tatsache widerzuspiegeln, dass die Fehler in den verschiedenen Modellen nicht tatsächlich gleich sind und daher nicht dieselben Symbole verwenden sollten.
Rónán Daly

Antworten:

6

ϵij

Im ersten Fall repräsentieren diese Begriffe Messfehler und Abweichungen vom additiven Modell. Mit angemessener Sorgfalt - beispielsweise durch Randomisierung der Messsequenz - können diese Fehler unabhängig gemacht werden, wenn das Modell genau ist. Woher

dij=YijYi0=γi+δj+ϵij(γi+δ0+ϵi0)=δj+(ϵijϵi0).

ϵi0=0γi

j,k0jk

Cov(dij,dik)=Cov(ϵijϵi0,ϵikϵi0)=Var(ϵi0)0.

Die Korrelation kann erheblich sein. Für iid-Fehler zeigt eine ähnliche Berechnung, dass sie gleich 0,5 ist. Wenn Sie keine Verfahren verwenden, die diese Korrelation explizit und korrekt behandeln, bevorzugen Sie das erste Modell gegenüber dem zweiten.

whuber
quelle
Sie haben also angenommen, dass das erste Modell das wahre Modell ist, und eine unerwünschte Eigenschaft des zweiten Modells abgeleitet. Wir wissen, dass alle Modelle falsch sind. Ist dieses Ergebnis wirklich sinnvoll?
Makro
1
@Macro Bitte lesen Sie meine Antwort genauer durch: Sie soll zeigen, welche Annahmen erforderlich sind, um das erste Modell zu rechtfertigen und vom zweiten zu unterscheiden, enthält jedoch keine Annahmen, dass ein Modell "wahr" ist. Beachten Sie beispielsweise die Einschränkung "Wenn das Modell genau ist". Sogar das Wort "genau" wurde gewählt, um den falschen Eindruck zu vermeiden, dass es ein "wahres" oder "korrektes" Modell gibt.
whuber
1
dik
1
jkj,k0
@whuber Gibt es Referenzen, die Ihre Aussage stützen, z. B. um Rezensenten zu überzeugen?
Daniel