Angenommen, ich interessiere mich für ein lineares Regressionsmodell für , weil ich sehen möchte, ob eine Wechselwirkung zwischen den beiden Kovariaten einen Einfluss auf Y hat.
In den Kursnotizen eines Professors (mit denen ich keinen Kontakt habe) heißt es: Wenn Sie Interaktionsbegriffe einbeziehen, sollten Sie deren Begriffe zweiten Grades angeben. dh sollte in die Regression einbezogen werden.
Warum sollte man Begriffe zweiten Grades aufnehmen, wenn wir nur an den Interaktionen interessiert sind?
Antworten:
Es kommt auf das Ziel der Folgerung an. Wenn Sie Rückschlüsse darauf ziehen möchten, ob eine Interaktion vorliegt, beispielsweise in einem kausalen Kontext (oder allgemeiner, wenn Sie den Interaktionskoeffizienten interpretieren möchten), ist diese Empfehlung Ihres Professors sinnvoll und stammt aus dem Tatsache, dass eine falsche Angabe der funktionalen Form zu falschen Schlussfolgerungen über die Interaktion führen kann .
Hier ist ein einfaches Beispiel, in dem es keinen Interaktionsterm zwischenx1 und x2 in der Strukturgleichung von y gibt. Wenn Sie jedoch den quadratischen Term von x1 nicht einbeziehen , würden Sie fälschlicherweise schließen, dass x1 mit x2 interagiert, wenn in der Tat nicht.
Dies kann einfach als ein Fall einer ausgelassenen variablen Vorspannung interpretiert werden, und hier istx21 die ausgelassene Variable. Wenn Sie zurückgehen und den quadratischen Term in Ihre Regression einbeziehen, verschwindet die offensichtliche Interaktion.
Natürlich gilt diese Argumentation nicht nur für quadratische Terme, sondern auch für die Fehlspezifikation der Funktionsform im Allgemeinen. Ziel ist es, die bedingte Erwartungsfunktion angemessen zu modellieren, um die Interaktion zu bewerten. Wenn Sie sich auf die Modellierung mit linearer Regression beschränken, müssen Sie diese nichtlinearen Terme manuell einfügen. Eine Alternative besteht jedoch darin, eine flexiblere Regressionsmodellierung zu verwenden, beispielsweise die Kernel-Ridge-Regression .
quelle
rm(list=ls())
in den hier veröffentlichten Code aufnehmen! Wenn Leute den Code einfach kopieren und einfügen und ausführen, könnten sie eine Überraschung bekommen ... Ich habe ihn vorerst entfernt.Das erste Modell kann folgendermaßen neu ausgedrückt werden:
Das zweite Modell kann folgendermaßen neu ausgedrückt werden:
Beachten Sie, dass ich die von Ihnen verwendete Notation aus Gründen der Konsistenz vereinfacht und den Fehlerbegriff in beiden Modellen explizit angegeben habe.
quelle