Hintergrund
Ich habe Daten aus einer Feldstudie, in der es vier Behandlungsstufen und sechs Wiederholungen in jedem von zwei Blöcken gibt. (4x6x2 = 48 Beobachtungen)
Die Blöcke sind ungefähr 1 Meile voneinander entfernt, und innerhalb der Blöcke gibt es ein Raster von 42, 2 mx 4 m großen Parzellen und einen 1 m breiten Gehweg; Meine Studie verwendete nur 24 Parzellen in jedem Block.
Ich möchte die räumliche Kovarianz bewerten.
Hier ist eine Beispielanalyse unter Verwendung der Daten aus einem einzelnen Block ohne Berücksichtigung der räumlichen Kovarianz. Im Datensatz plot
ist die Plot-ID x
die x-Position und y
die y-Position jedes Plots, wobei Plot 1 auf 0, 0 zentriert ist. Dies level
ist die Behandlungsstufe und response
die Antwortvariable.
layout <- structure(list(plot = c(1L, 3L, 5L, 7L, 8L, 11L, 12L, 15L, 16L,
17L, 18L, 22L, 23L, 26L, 28L, 30L, 31L, 32L, 35L, 36L, 37L, 39L,
40L, 42L), level = c(0L, 10L, 1L, 4L, 10L, 0L, 4L, 10L, 0L, 4L,
0L, 1L, 0L, 10L, 1L, 10L, 4L, 4L, 1L, 1L, 1L, 0L, 10L, 4L), response = c(5.93,
5.16, 5.42, 5.11, 5.46, 5.44, 5.78, 5.44, 5.15, 5.16, 5.17, 5.82,
5.75, 4.48, 5.25, 5.49, 4.74, 4.09, 5.93, 5.91, 5.15, 4.5, 4.82,
5.84), x = c(0, 0, 0, 3, 3, 3, 3, 6, 6, 6, 6, 9, 9, 12, 12, 12,
15, 15, 15, 15, 18, 18, 18, 18), y = c(0, 10, 20, 0, 5, 20, 25,
10, 15, 20, 25, 15, 20, 0, 15, 25, 0, 5, 20, 25, 0, 10, 20,
25)), .Names = c("plot", "level", "response", "x", "y"), row.names = c(NA,
-24L), class = "data.frame")
model <- lm(response ~ level, data = layout)
summary(model)
Fragen
- Wie kann ich eine Kovarianzmatrix berechnen und in meine Regression einbeziehen?
- Die Blöcke sind sehr unterschiedlich und es gibt starke Wechselwirkungen zwischen Behandlung und Block. Ist es angebracht, sie separat zu analysieren?
r
spatial
linear-model
covariance
David LeBauer
quelle
quelle
Antworten:
1) Sie können die räumliche Korrelation mit der
nlme
Bibliothek modellieren . Es gibt mehrere mögliche Modelle, die Sie auswählen können. Siehe Seiten 260-266 von Pinheiro / Bates.Ein guter erster Schritt besteht darin, ein Variogramm zu erstellen, um zu sehen, wie die Korrelation von der Entfernung abhängt.
Hier nimmt das Probensemivariogramm mit der Entfernung zu, was darauf hinweist, dass die Beobachtungen tatsächlich räumlich korreliert sind.
Eine Option für die Korrelationsstruktur ist eine sphärische Struktur; das könnte folgendermaßen modelliert werden.
Dieses Modell scheint besser zu passen als das Modell ohne Korrelationsstruktur, obwohl es durchaus möglich ist, dass es auch mit einer der anderen möglichen Korrelationsstrukturen verbessert werden könnte.
2) Sie können auch versuchen,
x
undy
direkt in das Modell aufzunehmen. Dies könnte angemessen sein, wenn das Korrelationsmuster von mehr als nur der Entfernung abhängt. In Ihrem Fall (wenn Sie sich die Bilder von sesqu ansehen) scheint es, dass Sie für diesen Block ohnehin ein diagonales Muster haben.Hier aktualisiere ich das Originalmodell anstelle von m0, da ich nur die festen Effekte ändere, sodass beide Modelle mit maximaler Wahrscheinlichkeit angepasst werden sollten.
Um alle drei Modelle zu vergleichen, müssen Sie sie alle mit
gls
und der Maximum-Likelihood-Methode anstelle der Standardmethode von REML anpassen.Denken Sie daran, dass Sie insbesondere mit Ihrem Wissen über die Studie möglicherweise ein Modell entwickeln können, das besser ist als jedes andere. Das heißt, das Modell
m2b
sollte noch nicht unbedingt als das beste angesehen werden.Hinweis: Diese Berechnungen wurden durchgeführt, nachdem der x-Wert von Diagramm 37 auf 0 geändert wurde.
quelle
model
anstelle vonm0
z.m2 <- update(m0, .~.+x*y)
so dass alle drei Modelle mit verglichen werden könnenanova(m0,m1,m2)
; nachdem dies getan wurde,m2
ist ein großer Verlierer (AIC = 64) es scheint, dass Ihr Teilm0
,m1
undm2
wie Sie vorschlagen , dass Sie die Warnung erhalten:Fitted objects with different fixed effects. REML comparisons are not meaningful.
Um feste Effekte vergleichen Sie haben Wahrscheinlichkeit regelmäßig maximal zu nutzen , anstatt REML. Siehe Bearbeiten.1) Was ist Ihre räumliche Erklärungsvariable? Es sieht so aus, als wäre die x * y-Ebene ein schlechtes Modell für den räumlichen Effekt.
2) Angesichts der Tatsache, dass die Blöcke 1 Meile voneinander entfernt sind und Sie Effekte für nur 30 Meter erwarten, würde ich sagen, dass es völlig angemessen ist, sie separat zu analysieren.
quelle