Ich möchte eine ANCOVA-Analyse der Daten zur Dichte der Pflanzenepiphyten durchführen. Zuerst würde ich gerne wissen, ob es einen Unterschied in der Pflanzendichte zwischen zwei Hängen gibt, einem N und einem S, aber ich habe andere Daten wie die Höhe, die Offenheit der Überdachung und die Höhe der Wirtspflanze. Ich weiß, dass meine Kovariate die beiden Steigungen (N und S) sein müsste. Ich habe dieses Modell gebaut, das in R läuft und obwohl ich keine Ahnung habe, ob es gut funktioniert. Auch würde ich gerne wissen, was der Unterschied ist, wenn ich das Symbol +
oder verwende *
.
model1 <- aov(density~slope+altitude+canopy+height)
summary(model1)
model1
Antworten:
Das grundlegende Werkzeug dafür ist
lm
; Beachten Sie, dass diesaov
ein Wrapper für istlm
.Insbesondere wenn Sie eine Gruppierungsvariable (Faktor),G und eine kontinuierliche Kovariate x ,
y ~ x + g
passt das Modell zu einem ANCOVA-Modell mit Haupteffekten, währendy ~ x * g
es zu einem Modell passt, das die Interaktion mit der Kovariate umfasst.aov
wird die gleichen Formeln annehmen.Achten Sie besonders auf die
Note
in der Hilfe aufaov
.Was
+
vs*
angeht, so behandelt russellpierce es ziemlich genau, aber ich empfehle Ihnen einen Blick auf?lm
und?formula
insbesondere auf Abschnitt 11.1 des Handbuchs Eine Einführung in R , das mit R geliefert wird (oder Sie können es online finden, wenn Sie nicht herausgefunden haben, wie Um es auf Ihrem Computer zu finden, müssen Sie am einfachsten das Pulldown-Menü "Hilfe" in R oder RStudio aufrufen.quelle
anova
(Sie werden bald sehen, ob Sie sie in der falschen Reihenfolge angeben, da einige SS negativ sind, wenn Sie dies tun )Ich empfehle, Discovering Statistics mit R by Field abzurufen und zu lesen . Er hat einen schönen Abschnitt über ANCOVA.
Um ANCOVA in R auszuführen, laden Sie die folgenden Pakete:
Wenn Sie
lm
oder verwendenaov
(ich verwendeaov
), stellen Sie sicher, dass Sie die Kontraste mit der Funktion "Kontraste" einstellen, bevor Sie entwederaov
oder ausführenlm
. R verwendet standardmäßig nicht-orthogonale Kontraste, die alles in einer ANCOVA durcheinander bringen können. Wenn Sie orthogonale Kontraste einstellen möchten, verwenden Sie:dann starte dein modell als
So zeigen Sie das Modell an:
Stellen Sie sicher, dass Sie hier das Großbuchstaben "A" verwenden
Anova
und nichtanova
. Dies ergibt Ergebnisse unter Verwendung von Typ III SS.summary.lm(model.1)
wird eine weitere Zusammenfassung geben und die R-sq enthält. Ausgabe.Wenn Sie die Homogenität von Regressionssteigungen testen möchten, können Sie auch einen Interaktionsterm für die IV und die Kovariate einfügen. Das wäre:
Wenn der Interaktionsterm signifikant ist, haben Sie keine Homogenität.
quelle
Hier finden Sie eine ergänzende Dokumentation http://goo.gl/yxUZ1R des von @Butorovich vorgeschlagenen Verfahrens. Außerdem ist meine Beobachtung, dass, wenn die Kovariate binär ist, die Verwendung der Zusammenfassung (lm.Objekt) die gleiche IV-Schätzung ergibt, wie sie von Anova erzeugt wird (lm.Objekt, Typ = "III").
quelle
ASK QUESTION
oben auf und stellen Sie sie dort. Dann können wir Ihnen richtig helfen.Wir verwenden die Regressionsanalyse, um Modelle zu erstellen, die die Auswirkung der Variation von Prädiktorvariablen auf die Antwortvariable beschreiben. Manchmal, wenn wir eine kategoriale Variable mit Werten wie Ja / Nein oder Männlich / Weiblich usw. haben, liefert die einfache Regressionsanalyse mehrere Ergebnisse für jeden Wert der kategorialen Variablen. In einem solchen Szenario können wir die Auswirkung der kategorialen Variablen untersuchen, indem wir sie zusammen mit der Prädiktorvariablen verwenden und die Regressionslinien für jede Ebene der kategorialen Variablen vergleichen. Eine solche Analyse wird als Analyse der Kovarianz bezeichnet, die auch als ANCOVA bezeichnet wird.
Beispiel
Betrachten Sie den
R
eingebauten Datensatzmtcars
. Darin beobachten wir, dass das Feldam
die Art der Übertragung darstellt (automatisch oder manuell). Es ist eine kategoriale Variable mit den Werten 0 und 1. Der Meilen pro Gallone-Wert (mpg
) eines Autos kann neben dem Wert der Pferdestärke (hp
) auch davon abhängen . Wir untersuchen die Auswirkung des Wertes vonam
auf die Regression zwischenmpg
undhp
. Dies geschieht mit deraov()
Funktion, gefolgt von deranova()
Funktion zum Vergleichen der mehreren Regressionen.Eingabedaten
eines Datenrahmens Erstellen Sie die Felder enthalten
mpg
,hp
undam
aus dem Datensatzmtcars
. Hier nehmen wirmpg
als Antwortvariable,hp
als Prädiktorvariable undam
als kategoriale Variable.Wenn wir den obigen Code ausführen, wird folgendes Ergebnis erzeugt:
ANCOVA-Analyse
Wir erstellen ein Regressionsmodell, das
hp
als Prädiktorvariable undmpg
als Antwortvariable die Wechselwirkung zwischen berücksichtigtam
undhp
.Modell mit Interaktion zwischen kategorialer Variable und Prädiktorvariable
Erstellen Sie ein Regressionsmodell1
Wenn wir den obigen Code ausführen, wird folgendes Ergebnis erzeugt:
Dieses Ergebnis zeigt, dass sowohl die Pferdestärke als auch der Getriebetyp einen signifikanten Einfluss auf die Meilen pro Gallone haben, da der p-Wert in beiden Fällen unter 0,05 liegt. Die Wechselwirkung zwischen diesen beiden Variablen ist jedoch nicht signifikant, da der p-Wert mehr als 0,05 beträgt.
Modell ohne Wechselwirkung zwischen kategorialer Variable und Prädiktorvariable
Erstellen Sie das Regressionsmodell2
Wenn wir den obigen Code ausführen, wird folgendes Ergebnis erzeugt:
Dieses Ergebnis zeigt, dass sowohl die Pferdestärke als auch der Getriebetyp einen signifikanten Einfluss auf die Meilen pro Gallone haben, da der p-Wert in beiden Fällen unter 0,05 liegt.
Vergleich zweier Modelle
Nun können wir die beiden Modelle vergleichen, um festzustellen, ob die Wechselwirkung der Variablen wirklich unbedeutend ist. Dafür verwenden wir die
anova()
Funktion.Da der p-Wert größer als 0,05 ist, schließen wir, dass die Wechselwirkung zwischen Pferdestärke und Getriebetyp nicht signifikant ist. Die Laufleistung pro Gallone hängt also in ähnlicher Weise von der Pferdestärke des Fahrzeugs sowohl im automatischen als auch im manuellen Getriebemodus ab.
quelle