Wie interpretiere ich den Interaktionsterm in der lm-Formel in R?

9

In R, wenn ich die lm()Funktion folgendermaßen aufrufe:

lm.1 = lm(response ~ var1 + var2 + var1 * var2)
summary(lm.1)

Das gibt mir ein lineares Modell der Antwortvariablen mit var1, var2und die Interaktion zwischen ihnen. Wie genau interpretieren wir den Interaktionsterm jedoch numerisch?

Die Dokumentation sagt, dass dies das "Kreuz" zwischen var1und ist var2, aber es gab keine Erklärung dafür, was genau das "Kreuz" ist.

Es wäre hilfreich für mich zu wissen, welche genauen Zahlen R berechnet, um die Wechselwirkung zwischen den beiden Variablen zu berücksichtigen.

Enzo
quelle
Möchten Sie speziell wissen, wie R die Entwurfsmatrix für diese Formel erstellt, oder sind Sie allgemeiner daran interessiert, wie ein solcher multiplikativer ("Interaktions") Begriff in Bezug auf das angepasste Modell interpretiert werden kann?
Momo
Ich bin mehr daran interessiert, wie man diesen multiplikativen Begriff interpretiert. Wenn ich zum Beispiel eine lineare Formel schreiben möchte (eine mathematische, keine R-Formel ...), was soll ich für den multiplikativen Term eingeben?
Enzo
Um zu erklären, was Kreuz bedeutet, werfen Sie einen Blick auf das Berechnen var3 <- var 1 * var2und Bauenlm.2 <- lm(response ~ var1 + var2 + var3)
James Stanley
1
Es ist also einfach eine eintragsbezogene Multiplikation?
Enzo
1
@Enzo, ja, ist das Kreuz buchstäblich die beiden Begriffe multipliziert - Interpretation weitgehend davon abhängen , ob var1und var2beide kontinuierlich (sehr schwer zu interpretieren, meiner Meinung nach ) , oder ob eine davon ist zB binäre kategorisches (. Einfacher zu betrachten) In dieser Antwort finden Sie einige Interpretationsbeispiele von Peter Flom: stats.stackexchange.com/a/45512/16974
James Stanley

Antworten:

8

Die Standardmethode zum Schreiben der Vorhersagegleichung für Ihr Modell lautet:

y^=b0+b1x1+b2x2+b12x1x2

Das Verständnis der Interaktion ist jedoch etwas einfacher, wenn wir dies anders berücksichtigen:

y^=(b0+b2x2)+(b1+b12x2)x1

Mit diesem factoring können wir für einen gegebenen Wert von sehen , dass der y-Achsenabschnitt für ist und die Steigung auf ist . Die Beziehung zwischen und hängt also von .x2x1b0+b2x2x1(b1+b12x2)yx1x2

Eine andere Möglichkeit, dies zu verstehen, besteht darin, die vorhergesagten Linien zwischen und für verschiedene Werte von (oder umgekehrt). Die und Funktionen im TeachingDemos-Paket für R wurden entwickelt, um bei diesen Arten von Plots zu helfen.yx1x2Predict.PlotTkPredict

Greg Snow
quelle
3

Angenommen, Sie erhalten Punktschätzungen von 4 für , 2 für und 1,5 für die Interaktion. Dann sagt die Gleichung, dass die Anpassung istx1x2lm

y=4x1+2x2+1.5x1x2

Ist es das was du wolltest?

Peter Flom - Monica wieder einsetzen
quelle
3

Interaktionen lassen sich am einfachsten anhand diskreter Variablen betrachten. Vielleicht haben Sie Zwei-Wege-ANOVAs untersucht, bei denen wir zwei Gruppierungsvariablen haben (z. B. Geschlecht und Alterskategorie mit drei Altersstufen) und untersuchen, wie sie sich auf ein kontinuierliches Maß beziehen (unsere abhängige Variable, z. B. IQ).

Der x1 * x2-Begriff kann, falls er signifikant ist (in diesem trivialen, erfundenen Beispiel) als IQ verstanden werden, der sich je nach Alter für die verschiedenen Geschlechter unterschiedlich verhält. Zum Beispiel ist der IQ für Männer in allen drei Altersgruppen möglicherweise stabil, aber junge Frauen beginnen unter jungen Männern und haben einen Aufwärtstrend (wobei die Altersgruppe einen höheren Mittelwert aufweist als die Altersgruppe für Männer). In einem Mittelwertdiagramm würde dies eine horizontale Linie für Männer in der Mitte des Diagramms und möglicherweise eine 45-Grad-Linie für Frauen bedeuten, die unter Männern beginnt, aber über Männern endet.

Das Wesentliche ist, dass sich das, was in der anderen Variablen vor sich geht, ändert, wenn Sie sich entlang der Ebenen einer Variablen bewegen (oder "X1 konstant halten"). Diese Interpretation funktioniert auch mit kontinuierlichen Prädiktorvariablen, ist aber nicht so einfach konkret darzustellen. In diesem Fall möchten Sie möglicherweise bestimmte Werte für X1 und X2 verwenden und sehen, was mit Y passiert.

Twitch_City
quelle