Gilt es jemals, eine bidirektionale Interaktion in ein Modell aufzunehmen, ohne die Haupteffekte einzubeziehen? Was ist, wenn es bei Ihrer Hypothese nur um die Interaktion geht, müssen Sie dann noch die Haupteffekte berücksichtigen?
85
Antworten:
Nach meiner Erfahrung ist es nicht nur erforderlich, alle Effekte niedrigerer Ordnung im Modell zu haben, wenn sie mit Effekten höherer Ordnung verbunden sind, sondern es ist auch wichtig, Haupteffekte richtig zu modellieren (z. B. nichtlineare Effekte zulassen), mit denen scheinbar keine Beziehung besteht die Faktoren in den Wechselwirkungen von Interesse. Das liegt daran, dass Interaktionen zwischen und für die Haupteffekte von und als . Manchmal scheinen Interaktionen erforderlich zu sein, weil sie mit ausgelassenen Variablen oder ausgelassenen nichtlinearen (z. B. Spline-) Begriffen kollinear sind.x 2 x 3X1 X2 X3 X4
quelle
Sie fragen, ob es jemals gültig ist. Lassen Sie mich ein allgemeines Beispiel anführen, dessen Erläuterung möglicherweise zusätzliche analytische Ansätze für Sie nahe legt.
Das einfachste Beispiel für eine Interaktion ist ein Modell mit einer abhängigen Variablen und zwei unabhängigen Variablen , im FormularX YZ X Y.
mit eine zufällige Termvariable mit Nullerwartung und unter Verwendung der Parameter und . Oft lohnt es sich zu prüfen, ob ungefähr , da es sich um einen algebraisch äquivalenten Ausdruck des gleichen Modells handelt& agr; , β ' , γ ' , δ ' δ ' β ' γ 'ε α , β′, γ′, δ′ δ′ β′γ′
(wo , etc).β′=αβ
Woher, wenn es einen Grund gibt anzunehmen, dass , können wir es in den Fehlerbegriff . Dies führt nicht nur zu einer "reinen Interaktion", sondern auch ohne konstanten Begriff. Dies wiederum deutet stark auf Logarithmen hin. Eine gewisse Heteroskedastizität in den Residuen - das heißt eine Tendenz für Residuen, die mit größeren Werten von assoziiert sind und einen größeren absoluten Wert als der Durchschnitt aufweisen - würde ebenfalls in diese Richtung weisen. Wir würden dann eine alternative Formulierung untersuchen wollenε Z(δ−βγ)∼0 ε Z
mit einem zufälligen Fehler . Wenn wir außerdem erwarten, dass und im Vergleich zu groß sind , würden wir stattdessen nur das Modell vorschlagen& bgr; X γτ βX 1γY 1
Dieses neue Modell hat nur einen einzigen Parameter anstelle von vier Parametern ( ;, usw.), die einer quadratischen Beziehung ( ) unterliegen , was eine erhebliche Vereinfachung darstellt.α β ′ δ ′ = β ′ γ ′η α β′ δ′=β′γ′
Ich sage nicht, dass dies ein notwendiger oder sogar einziger Schritt ist, aber ich schlage vor, dass diese Art der algebraischen Neuordnung des Modells normalerweise in Betracht gezogen werden sollte, wenn Wechselwirkungen allein als signifikant erscheinen.
In den Kapiteln 10 bis 13 von Tukeys EDA finden Sie einige hervorragende Möglichkeiten, Modelle mit Interaktion zu untersuchen, insbesondere mit nur zwei und drei unabhängigen Variablen .
quelle
Während in Lehrbüchern häufig angegeben wird, dass man eine Interaktion in einem Modell niemals ohne die entsprechenden Haupteffekte aufnehmen sollte, gibt es sicherlich Beispiele, bei denen dies durchaus Sinn macht. Ich gebe Ihnen das einfachste Beispiel, das ich mir vorstellen kann.
Angenommen, Probanden, die zufällig zwei Gruppen zugeordnet wurden, werden zweimal gemessen, einmal zu Beginn (dh unmittelbar nach der Randomisierung) und einmal, nachdem Gruppe T irgendeine Art von Behandlung erhalten hat, während Gruppe C dies nicht tat. Dann würde ein Messwiederholungsmodell für diese Daten einen Haupteffekt für Messanlässe (eine Dummy-Variable, die 0 für die Basislinie und 1 für das Follow-up ist) und einen Interaktionsterm zwischen dem Gruppen-Dummy (0 für C, 1 für T) enthalten ) und die Zeitattrappe.
Der Modellabschnitt schätzt dann die durchschnittliche Punktzahl der Probanden zu Studienbeginn (unabhängig von der Gruppe, in der sie sich befinden). Der Koeffizient für die Messanlassattrappe gibt die Änderung in der Kontrollgruppe zwischen der Basislinie und dem Follow-up an. Der Koeffizient für den Interaktionsterm gibt an, um wie viel größer / kleiner die Änderung in der Behandlungsgruppe im Vergleich zur Kontrollgruppe war.
Hier muss der Haupteffekt für die Gruppe nicht berücksichtigt werden, da die Gruppen zu Beginn aufgrund der Randomisierung per Definition gleichwertig sind.
Man könnte natürlich argumentieren, dass der Haupteffekt für die Gruppe immer noch einbezogen werden sollte, so dass im Falle eines Scheiterns der Randomisierung dies durch die Analyse aufgedeckt wird. Dies ist jedoch gleichbedeutend mit dem Testen der Grundlinienmittel der beiden Gruppen gegeneinander. Und es gibt viele Leute, die beim Testen auf Unterschiede in der Grundlinie in randomisierten Studien die Stirn runzeln (natürlich gibt es auch viele, die es nützlich finden, aber dies ist ein anderes Problem).
quelle
Der Grund, die Haupteffekte im Modell beizubehalten, liegt in der Erkennbarkeit. Wenn es sich also um statistische Rückschlüsse auf die einzelnen Effekte handelt, sollten Sie die Haupteffekte im Modell beibehalten. Wenn Ihr Modellierungszweck jedoch ausschließlich darin besteht, neue Werte vorherzusagen, ist es absolut legitim, nur die Interaktion einzubeziehen, wenn dies die Vorhersagegenauigkeit verbessert.
quelle
Dies ist implizit in vielen Antworten enthalten, die andere gegeben haben. Der einfache Punkt ist jedoch, dass Modelle mit einem Produktbegriff und ohne Moderator und Prädiktor nur unterschiedliche Modelle sind. Finden Sie heraus, was die einzelnen Bedeutungen für den Prozess bedeuten , den Sie modellieren, und ob ein Modell ohne Moderator und Prädiktor angesichts Ihrer Theorie oder Hypothese sinnvoller ist. Die Beobachtung, dass der Produktbegriff signifikant ist, aber nur, wenn Moderator und Prädiktor nicht enthalten sind, sagt nichts aus (außer vielleicht, dass Sie nach "Signifikanz" fischen), ohne eine überzeugende Erklärung, warum es sinnvoll ist, sie wegzulassen .
quelle
Es hängt wohl davon ab, wofür Sie Ihr Modell verwenden. Aber ich habe noch nie einen Grund gesehen, Modelle mit Haupteffekten nicht auszuführen und zu beschreiben, selbst in Fällen, in denen es bei der Hypothese nur um die Interaktion geht.
quelle
Ich werde einen Absatz aus dem Buch Eine Einführung in die Überlebensanalyse mit Stata von M.Cleves, R.Gutierrez, W.Gould, Y.Marchenko, herausgegeben von Stata Press , ausleihen, um Ihre Frage zu beantworten.
quelle
Sowohl x als auch y werden mit xy korreliert (es sei denn, Sie haben eine bestimmte Maßnahme getroffen, um dies durch Zentrierung zu verhindern). Wenn Sie also mit Ihrem Ansatz einen wesentlichen Interaktionseffekt erzielen, werden sich wahrscheinlich ein oder mehrere Haupteffekte als Interaktion tarnen. Dies wird keine klaren, interpretierbaren Ergebnisse liefern. Was wünschenswert ist, ist stattdessen zu sehen, wie viel die Wechselwirkung darüber hinaus erklären kann, was die Haupteffekte bewirken, indem x , y und (vorzugsweise in einem nachfolgenden Schritt) xy einbezogen werden .
Zur Terminologie: Ja, β 0 wird als "Konstante" bezeichnet. Andererseits hat "partiell" eine bestimmte Bedeutung für die Regression und daher würde ich diesen Begriff hier nicht verwenden, um Ihre Strategie zu beschreiben.
Einige interessante Beispiele, die einmal in einem blauen Mond auftauchen werden, werden in diesem Thread beschrieben .
quelle
Ich würde vorschlagen, dass es einfach ein Sonderfall von Modellunsicherheit ist. Aus bayesianischer Sicht behandeln Sie dies einfach genauso, wie Sie jede andere Art von Unsicherheit behandeln würden, indem Sie entweder:
Und Sie können daraus dass die "bedingte Schlussfolgerung" der Hypothese unter dem m-ten Modell ist (dies ist normalerweise alles, was für ein ausgewähltes "bestes" Modell in Betracht gezogen wird ). Beachten Sie, dass diese Standardanalyse immer dann gerechtfertigt ist, wenn - ein "offensichtlich bestes" Modell - oder wenn - Alle Modelle geben die gleichen / ähnlichen Schlussfolgerungen. Wenn jedoch keines der beiden Kriterien erfüllt ist, besteht das beste Verfahren nach dem Bayes-Theorem darin, die Ergebnisse zu mitteln und die Modelle zu gewichten, die von den Daten und früheren Informationen am meisten unterstützt werden.P ( M m | D I ) ≈ 1 P ( H i n t | D M j I ) ≈ P ( H i n t | D M k I )P(Hint|DMmI) P(Mm|DI)≈1 P(Hint|DMjI)≈P(Hint|DMkI)
quelle
Es ist sehr selten eine gute Idee, einen Interaktionsbegriff ohne die damit verbundenen Haupteffekte aufzunehmen. David Rindskopf von CCNY hat einige Artikel über diese seltenen Fälle geschrieben.
quelle
Es gibt verschiedene Prozesse in der Natur, die nur einen Interaktionseffekt beinhalten, und Gesetze, die sie beschreiben. Zum Beispiel das Ohmsche Gesetz. In der Psychologie haben Sie zum Beispiel das Leistungsmodell von Vroom (1964): Leistung = Fähigkeit x Motivation. Nun können Sie erwarten, einen signifikanten Interaktionseffekt zu finden, wenn dieses Gesetz wahr ist. Leider ist dies nicht der Fall. Es kann leicht vorkommen, dass Sie zwei Haupteffekte und einen unbedeutenden Interaktionseffekt finden (für eine Demonstration und weitere Erklärung siehe Landsheer, van den Wittenboer und Maassen (2006), Social Science Research 35, 274-294). Das lineare Modell eignet sich nicht sehr gut zur Erkennung von Interaktionseffekten. Ohm hätte sein Gesetz vielleicht nie gefunden, wenn er lineare Modelle verwendet hätte.
Die Interpretation von Interaktionseffekten in linearen Modellen ist daher schwierig. Wenn Sie eine Theorie haben, die einen Interaktionseffekt vorhersagt, sollten Sie diesen auch dann einbeziehen, wenn er unbedeutend ist. Möglicherweise möchten Sie Haupteffekte ignorieren, wenn Ihre Theorie diese ausschließt, aber Sie werden es schwierig finden, da bei einem Mechanismus zur Erzeugung echter Daten, der nur einen multiplikativen Effekt hat, häufig signifikante Haupteffekte auftreten.
Meine Antwort lautet: Ja, es kann gültig sein, eine bidirektionale Interaktion in ein Modell aufzunehmen, ohne die Haupteffekte einzubeziehen. Lineare Modelle sind hervorragende Werkzeuge, um die Ergebnisse einer Vielzahl von Datenerzeugungsmechanismen zu approximieren. Ihre Formeln können jedoch nicht einfach als gültige Beschreibung des Datenerzeugungsmechanismus interpretiert werden.
quelle
Dieser ist knifflig und mir in meinem letzten Projekt passiert. Ich würde es so erklären: Nehmen wir an, Sie hatten Variablen A und B, die unabhängig voneinander von Bedeutung waren, und Sie hielten eine Interaktion von A und B aus geschäftlicher Sicht für gut. Sie haben die Interaktion einbezogen, die sich als signifikant herausgestellt hat, aber B hat seine Bedeutung verloren. Sie würden Ihr Modell zunächst anhand von zwei Ergebnissen erläutern. Die Ergebnisse würden zeigen, dass B anfangs signifikant war, aber im Lichte von A seinen Glanz verlor. Also ist B eine gute Variable, aber nur im Lichte der verschiedenen Ebenen von A (wenn A eine kategoriale Variable ist). Es ist so, als würde man sagen, Obama sei ein guter Führer, wenn man es im Lichte seiner SEAL-Armee sieht. Das Obama-Siegel wird also eine bedeutende Variable sein. Aber allein gesehen ist Obama vielleicht nicht so wichtig. (Kein Vergehen gegen Obama, nur ein Beispiel.)
quelle
F = m * a, Kraft ist gleich Masse mal Beschleunigung.
Es wird nicht als F = m + a + ma oder irgendeine andere lineare Kombination dieser Parameter dargestellt. Tatsächlich wäre nur die Wechselwirkung zwischen Masse und Beschleunigung physikalisch sinnvoll.
quelle
Ja, es kann gültig und sogar notwendig sein. Wenn Sie zum Beispiel in 2. einen Faktor für den Haupteffekt (durchschnittlicher Unterschied zwischen Blau und Rot) eingeben, würde dies das Modell verschlechtern.
Ihre Hypothese könnte zutreffen, unabhängig davon, ob ein Haupteffekt vorliegt. Das Modell benötigt es jedoch möglicherweise, um den zugrunde liegenden Prozess am besten zu beschreiben. Also ja, du solltest es mit und ohne probieren.
Hinweis: Sie müssen den Code für die "kontinuierliche" unabhängige Variable zentrieren (Messung im Beispiel). Andernfalls werden die Interaktionskoeffizienten im Modell nicht symmetrisch verteilt (kein Koeffizient für die erste Messung im Beispiel).
quelle
Wenn die fraglichen Variablen kategorisiert sind, ist das Einschließen von Interaktionen ohne die Haupteffekte nur eine Neuparametrisierung des Modells. Die Wahl der Parametrisierung hängt davon ab, was Sie mit Ihrem Modell erreichen möchten. Die Interaktion von stetigen Variablen mit anderen stetigen Variablen oder mit kategorialen Variablen ist eine ganz andere Geschichte. Siehe: Siehe diese FAQ vom UCLA-Institut für digitale Forschung und Bildung
quelle
Ja, dies kann gültig sein, obwohl es selten ist. In diesem Fall müssen Sie jedoch noch die Haupteffekte modellieren, die Sie anschließend zurückführen.
In der Tat ist in einigen Modellen nur die Interaktion interessant, wie z. B. Drogentests / klinische Modelle. Dies ist zum Beispiel die Grundlage des Generalized PsychoPhysiological Interactions (gPPI) -Modells:
y = ax + bxh + ch
Wox/y
sind Voxel / Regionen von Interesse undh
die Block- / Ereignisdesigns ?In diesem Modell werden beide,
a
undc
sie werden herausgeregelt, nurb
zur Inferenz aufbewahrt (die Beta-Koeffizienten). In der Tat repräsentieren beidea
undc
in unserem Fall eine unechte Aktivität und repräsentieren nurb
das, was nicht durch unechte Aktivität erklärt werden kann, die Interaktion mit der Aufgabe.quelle
Die kurze Antwort: Wenn Sie die Interaktion in die festen Effekte einbeziehen, werden die Haupteffekte automatisch einbezogen, unabhängig davon, ob Sie sie speziell in Ihren Code einbeziehen oder nicht . Der einzige Unterschied ist Ihre Parametrisierung, dh was die Parameter in Ihrem Modell bedeuten (z. B. sind sie Gruppenmittelwerte oder sind sie Unterschiede zu Referenzwerten).
Ich habe gerade gesehen, dass David Beede eine sehr ähnliche Antwort lieferte (Entschuldigung), aber ich dachte, ich würde dies denen überlassen, die gut auf eine lineare Algebra-Perspektive reagieren.
quelle