In R, wenn ich die lm()
Funktion folgendermaßen aufrufe:
lm.1 = lm(response ~ var1 + var2 + var1 * var2)
summary(lm.1)
Das gibt mir ein lineares Modell der Antwortvariablen mit var1
, var2
und die Interaktion zwischen ihnen. Wie genau interpretieren wir den Interaktionsterm jedoch numerisch?
Die Dokumentation sagt, dass dies das "Kreuz" zwischen var1
und ist var2
, aber es gab keine Erklärung dafür, was genau das "Kreuz" ist.
Es wäre hilfreich für mich zu wissen, welche genauen Zahlen R berechnet, um die Wechselwirkung zwischen den beiden Variablen zu berücksichtigen.
r
regression
Enzo
quelle
quelle
var3 <- var 1 * var2
und Bauenlm.2 <- lm(response ~ var1 + var2 + var3)
var1
undvar2
beide kontinuierlich (sehr schwer zu interpretieren, meiner Meinung nach ) , oder ob eine davon ist zB binäre kategorisches (. Einfacher zu betrachten) In dieser Antwort finden Sie einige Interpretationsbeispiele von Peter Flom: stats.stackexchange.com/a/45512/16974Antworten:
Die Standardmethode zum Schreiben der Vorhersagegleichung für Ihr Modell lautet:
Das Verständnis der Interaktion ist jedoch etwas einfacher, wenn wir dies anders berücksichtigen:
Mit diesem factoring können wir für einen gegebenen Wert von sehen , dass der y-Achsenabschnitt für ist und die Steigung auf ist . Die Beziehung zwischen und hängt also von .x2 x1 b0+ b2∗ x2 x1 ( b1+ b12∗ x2) y x1 x2
Eine andere Möglichkeit, dies zu verstehen, besteht darin, die vorhergesagten Linien zwischen und für verschiedene Werte von (oder umgekehrt). Die und Funktionen im TeachingDemos-Paket für R wurden entwickelt, um bei diesen Arten von Plots zu helfen.y x1 x2
Predict.Plot
TkPredict
quelle
Angenommen, Sie erhalten Punktschätzungen von 4 für , 2 für und 1,5 für die Interaktion. Dann sagt die Gleichung, dass die Anpassung istx1 x2
lm
Ist es das was du wolltest?
quelle
Interaktionen lassen sich am einfachsten anhand diskreter Variablen betrachten. Vielleicht haben Sie Zwei-Wege-ANOVAs untersucht, bei denen wir zwei Gruppierungsvariablen haben (z. B. Geschlecht und Alterskategorie mit drei Altersstufen) und untersuchen, wie sie sich auf ein kontinuierliches Maß beziehen (unsere abhängige Variable, z. B. IQ).
Der x1 * x2-Begriff kann, falls er signifikant ist (in diesem trivialen, erfundenen Beispiel) als IQ verstanden werden, der sich je nach Alter für die verschiedenen Geschlechter unterschiedlich verhält. Zum Beispiel ist der IQ für Männer in allen drei Altersgruppen möglicherweise stabil, aber junge Frauen beginnen unter jungen Männern und haben einen Aufwärtstrend (wobei die Altersgruppe einen höheren Mittelwert aufweist als die Altersgruppe für Männer). In einem Mittelwertdiagramm würde dies eine horizontale Linie für Männer in der Mitte des Diagramms und möglicherweise eine 45-Grad-Linie für Frauen bedeuten, die unter Männern beginnt, aber über Männern endet.
Das Wesentliche ist, dass sich das, was in der anderen Variablen vor sich geht, ändert, wenn Sie sich entlang der Ebenen einer Variablen bewegen (oder "X1 konstant halten"). Diese Interpretation funktioniert auch mit kontinuierlichen Prädiktorvariablen, ist aber nicht so einfach konkret darzustellen. In diesem Fall möchten Sie möglicherweise bestimmte Werte für X1 und X2 verwenden und sehen, was mit Y passiert.
quelle