Einbeziehen der Interaktion, jedoch nicht der Haupteffekte in ein Modell

85

Gilt es jemals, eine bidirektionale Interaktion in ein Modell aufzunehmen, ohne die Haupteffekte einzubeziehen? Was ist, wenn es bei Ihrer Hypothese nur um die Interaktion geht, müssen Sie dann noch die Haupteffekte berücksichtigen?

Tal
quelle
3
Meine Philosophie ist, viele Modelle laufen zu lassen, ihre Vorhersagen zu überprüfen, zu vergleichen, zu erklären, mehr Modelle laufen zu lassen.
Michael Bishop
11
Wenn die Wechselwirkungen nur dann von Bedeutung sind, wenn sich die Haupteffekte im Modell befinden, sind möglicherweise die Haupteffekte von Bedeutung und die Wechselwirkungen nicht. Betrachten Sie einen hochsignifikanten Haupteffekt mit einer Varianz in der Größenordnung von 100 und einen anderen unbedeutenden Haupteffekt, für den alle Werte ungefähr eins mit einer sehr geringen Varianz sind. Ihre Interaktion ist nicht signifikant, aber der Interaktionseffekt scheint signifikant zu sein, wenn die Haupteffekte aus dem Modell entfernt werden.
Thomas Levine
4
@Thomas sollte in Ihrer ersten Zeile lauten: "Wenn die Wechselwirkungen nur dann von Bedeutung sind, wenn die Haupteffekte NICHT im Modell vorhanden sind, ..."?
Glen
2
Oh ja, das sollte es!
Thomas Levine

Antworten:

55

Nach meiner Erfahrung ist es nicht nur erforderlich, alle Effekte niedrigerer Ordnung im Modell zu haben, wenn sie mit Effekten höherer Ordnung verbunden sind, sondern es ist auch wichtig, Haupteffekte richtig zu modellieren (z. B. nichtlineare Effekte zulassen), mit denen scheinbar keine Beziehung besteht die Faktoren in den Wechselwirkungen von Interesse. Das liegt daran, dass Interaktionen zwischen und für die Haupteffekte von und als . Manchmal scheinen Interaktionen erforderlich zu sein, weil sie mit ausgelassenen Variablen oder ausgelassenen nichtlinearen (z. B. Spline-) Begriffen kollinear sind.x 2 x 3x1x2x3x4

Frank Harrell
quelle
1
Dies bedeutet, dass wir mit dem Löschen der Terme ab y ~ x1 * x2 * x3 * x4 beginnen sollten und mit dem Löschen der Terme höchster Ordnung, dh der normalen Löschmethode, beginnen sollten, oder?
Neugierig
9
Das Löschen von Begriffen wird nicht empfohlen, es sei denn, Sie können ganze Klassen von Begriffen als "Block" testen. Beispielsweise kann es sinnvoll sein, alle Interaktionsbegriffe beizubehalten oder zu löschen oder alle Interaktionen 3. oder 4. Ordnung beizubehalten oder zu löschen.
Frank Harrell
Was ist falsch daran, nur einige der Interaktionen in einer bestimmten Reihenfolge zu löschen?
user1205901
3
Wenn Sie eine vollständig vordefinierte Reihenfolge haben, die nicht anhand der Daten ermittelt wurde, können Sie dies möglicherweise tun. Im Allgemeinen treten bei Mehrfachentscheidungen mit mehreren P-Werten Probleme mit der Ko-Linearität und der Multiplizität auf.
Frank Harrell
2
Ich halte diese Antwort für unklar und beantworte die Frage nur teilweise. In dieser Antwort wird zwar angegeben, dass der Haupteffekt modelliert werden muss, es wird jedoch nicht beantwortet, ob eine Regression zulässig ist, um sich nur auf die Interaktion zu konzentrieren, die es ist und in einigen Modellen wie dem gPPI verwendet wird (siehe meine Antwort) unten).
Gaborous
37

Sie fragen, ob es jemals gültig ist. Lassen Sie mich ein allgemeines Beispiel anführen, dessen Erläuterung möglicherweise zusätzliche analytische Ansätze für Sie nahe legt.

Das einfachste Beispiel für eine Interaktion ist ein Modell mit einer abhängigen Variablen und zwei unabhängigen Variablen , im FormularX YZXY

Z=α+βX+γY+δXY+ε,

mit eine zufällige Termvariable mit Nullerwartung und unter Verwendung der Parameter und . Oft lohnt es sich zu prüfen, ob ungefähr , da es sich um einen algebraisch äquivalenten Ausdruck des gleichen Modells handelt& agr; , β ' , γ ' , δ ' δ ' β ' γ 'εα,β,γ,δδβγ

Z=α(1+βX+γY+δXY)+ε

=α(1+βX)(1+γY)+α(δβγ)XY+ε

(wo , etc).β=αβ

Woher, wenn es einen Grund gibt anzunehmen, dass , können wir es in den Fehlerbegriff . Dies führt nicht nur zu einer "reinen Interaktion", sondern auch ohne konstanten Begriff. Dies wiederum deutet stark auf Logarithmen hin. Eine gewisse Heteroskedastizität in den Residuen - das heißt eine Tendenz für Residuen, die mit größeren Werten von assoziiert sind und einen größeren absoluten Wert als der Durchschnitt aufweisen - würde ebenfalls in diese Richtung weisen. Wir würden dann eine alternative Formulierung untersuchen wollenε Z(δβγ)0εZ

log(Z)=log(α)+log(1+βX)+log(1+γY)+τ

mit einem zufälligen Fehler . Wenn wir außerdem erwarten, dass und im Vergleich zu groß sind , würden wir stattdessen nur das Modell vorschlagen& bgr; X γτβX1γY1

log(Z)=(log(α)+log(β)+log(γ))+log(X)+log(Y)+τ

=η+log(X)+log(Y)+τ.

Dieses neue Modell hat nur einen einzigen Parameter anstelle von vier Parametern ( ;, usw.), die einer quadratischen Beziehung ( ) unterliegen , was eine erhebliche Vereinfachung darstellt.α β δ = β γ ηαβδ=βγ

Ich sage nicht, dass dies ein notwendiger oder sogar einziger Schritt ist, aber ich schlage vor, dass diese Art der algebraischen Neuordnung des Modells normalerweise in Betracht gezogen werden sollte, wenn Wechselwirkungen allein als signifikant erscheinen.

In den Kapiteln 10 bis 13 von Tukeys EDA finden Sie einige hervorragende Möglichkeiten, Modelle mit Interaktion zu untersuchen, insbesondere mit nur zwei und drei unabhängigen Variablen .

whuber
quelle
Können Sie ein Beispiel dafür geben, wann Sie davon ausgehen können, dass Null geht? Es fällt mir schwer, mir diese Begriffe in Bezug auf die ursprünglichen Begriffe und deren Bedeutung vorzustellen. δβγ
Djhocking
@djhocking Jede Situation, in der die alternative Formulierung ein gutes Modell ist, impliziert notwendigerweise im ersten Modell. Ein Sonderfall ist das endgültige Modell, bei dem es sich um eine einfache lineare Beziehung zwischen und den Logs von und , die einer multiplikativen Beziehung auf der ursprünglichen Skala entspricht. Solche Beziehungen gibt es in der Natur zuhauf - es heißt einfach, dass direkt und getrennt proportional zu und . log ( Z ) X Y Z α X Y Z X Yα(δβγ)0log(Z)XYZXYZXY
whuber
30

Während in Lehrbüchern häufig angegeben wird, dass man eine Interaktion in einem Modell niemals ohne die entsprechenden Haupteffekte aufnehmen sollte, gibt es sicherlich Beispiele, bei denen dies durchaus Sinn macht. Ich gebe Ihnen das einfachste Beispiel, das ich mir vorstellen kann.

Angenommen, Probanden, die zufällig zwei Gruppen zugeordnet wurden, werden zweimal gemessen, einmal zu Beginn (dh unmittelbar nach der Randomisierung) und einmal, nachdem Gruppe T irgendeine Art von Behandlung erhalten hat, während Gruppe C dies nicht tat. Dann würde ein Messwiederholungsmodell für diese Daten einen Haupteffekt für Messanlässe (eine Dummy-Variable, die 0 für die Basislinie und 1 für das Follow-up ist) und einen Interaktionsterm zwischen dem Gruppen-Dummy (0 für C, 1 für T) enthalten ) und die Zeitattrappe.

Der Modellabschnitt schätzt dann die durchschnittliche Punktzahl der Probanden zu Studienbeginn (unabhängig von der Gruppe, in der sie sich befinden). Der Koeffizient für die Messanlassattrappe gibt die Änderung in der Kontrollgruppe zwischen der Basislinie und dem Follow-up an. Der Koeffizient für den Interaktionsterm gibt an, um wie viel größer / kleiner die Änderung in der Behandlungsgruppe im Vergleich zur Kontrollgruppe war.

Hier muss der Haupteffekt für die Gruppe nicht berücksichtigt werden, da die Gruppen zu Beginn aufgrund der Randomisierung per Definition gleichwertig sind.

Man könnte natürlich argumentieren, dass der Haupteffekt für die Gruppe immer noch einbezogen werden sollte, so dass im Falle eines Scheiterns der Randomisierung dies durch die Analyse aufgedeckt wird. Dies ist jedoch gleichbedeutend mit dem Testen der Grundlinienmittel der beiden Gruppen gegeneinander. Und es gibt viele Leute, die beim Testen auf Unterschiede in der Grundlinie in randomisierten Studien die Stirn runzeln (natürlich gibt es auch viele, die es nützlich finden, aber dies ist ein anderes Problem).

Wolfgang
quelle
4
Probleme treten auf, wenn die Messung zum Zeitpunkt Null (Basislinie) als erste Antwortvariable verwendet wird. Die Baseline wird häufig als Einstiegskriterium für die Studie verwendet. Zum Beispiel könnte eine Studie Patienten mit einem systolischen Blutdruck (bp)> 140 einschließen, dann auf 2 bp randomisieren und den bps folgen. Anfangs hat bp eine abgeschnittene Verteilung und die späteren Messungen sind symmetrischer. Es ist unübersichtlich, 2 Verteilungsformen im selben Modell zu modellieren. Es gibt viele weitere Gründe, die Basislinie als Basiskovariate zu behandeln.
Frank Harrell
3
Das ist ein guter Punkt, aber aktuelle Studien legen nahe, dass dies kein Problem ist. Tatsächlich scheint es mehr Nachteile zu geben, wenn Baseline-Scores als Kovariate verwendet werden. Siehe: Liu, GF et al. (2009). Sollte die Baseline eine kovariate oder abhängige Variable bei der Analyse der Veränderung gegenüber der Baseline in klinischen Studien sein? Statistics in Medicine, 28, 2509-2530.
Wolfgang
3
Ich habe die Zeitung gelesen. Es ist nicht überzeugend und Liu hat eine Vielzahl der von mir beschriebenen klinischen Testsituationen nicht untersucht. Weitere Argumente finden Sie unter biostat.mc.vanderbilt.edu/wiki/pub/Main/RmS/course2.pdf im Kapitel über die Analyse serieller (Längs-) Daten.
Frank Harrell
1
Danke für den Link. Ich gehe davon aus, dass Sie sich auf die Diskussion unter 8.2.3 beziehen. Das sind einige interessante Punkte, aber ich glaube nicht, dass dies eine eindeutige Antwort gibt. Ich bin sicher, dass das Papier von Liu et al. ist auch nicht die endgültige Antwort, aber es deutet zum Beispiel darauf hin, dass die Nichtnormalität der Grundlinienwerte kein entscheidendes Problem darstellt. Möglicherweise handelt es sich hierbei um einen separaten Diskussionspunkt, da dieser nicht direkt mit der Frage des OP zusammenhängt.
Wolfgang
2
Ja, es kommt auf den Grad der Nichtnormalität an. Warum bei der Formulierung eines Modells vom Glück abhängen? Es gibt auch viele rein philosophische Gründe, Zeit-Null-Messungen als Basismessungen zu behandeln (siehe Zitate von Senn und Rochon in meinen Notizen).
Frank Harrell
19

Der Grund, die Haupteffekte im Modell beizubehalten, liegt in der Erkennbarkeit. Wenn es sich also um statistische Rückschlüsse auf die einzelnen Effekte handelt, sollten Sie die Haupteffekte im Modell beibehalten. Wenn Ihr Modellierungszweck jedoch ausschließlich darin besteht, neue Werte vorherzusagen, ist es absolut legitim, nur die Interaktion einzubeziehen, wenn dies die Vorhersagegenauigkeit verbessert.

Galit Shmueli
quelle
5
Können Sie bitte etwas genauer auf das Problem der Identifizierbarkeit eingehen?
20.
6
Ich glaube nicht, dass ein Modell, bei dem die Haupteffekte weggelassen werden, unbedingt unbekannt ist. Vielleicht meinen Sie "Interpretierbarkeit" anstatt "Identifizierbarkeit" (was ein technischer Begriff mit einer genauen Definition ist)
JMS
6
@ JMS: Ja, es macht die Interpretierbarkeit zunichte. Der Begriff "Identifizierbarkeit" wird jedoch von Statistikern und Sozialwissenschaftlern unterschiedlich verwendet. Ich meinte letzteres, wo Sie (lose gesprochen) jeden statistischen Parameter mit einem bestimmten Konstrukt identifizieren möchten. Wenn Sie den Haupteffekt löschen, können Sie das Konstrukt nicht mehr dem Parameter zuordnen.
Galit Shmueli
13

Dies ist implizit in vielen Antworten enthalten, die andere gegeben haben. Der einfache Punkt ist jedoch, dass Modelle mit einem Produktbegriff und ohne Moderator und Prädiktor nur unterschiedliche Modelle sind. Finden Sie heraus, was die einzelnen Bedeutungen für den Prozess bedeuten , den Sie modellieren, und ob ein Modell ohne Moderator und Prädiktor angesichts Ihrer Theorie oder Hypothese sinnvoller ist. Die Beobachtung, dass der Produktbegriff signifikant ist, aber nur, wenn Moderator und Prädiktor nicht enthalten sind, sagt nichts aus (außer vielleicht, dass Sie nach "Signifikanz" fischen), ohne eine überzeugende Erklärung, warum es sinnvoll ist, sie wegzulassen .

dmk38
quelle
Ich bin hierher gekommen, um die Interpretation der Haupteffekte in Gegenwart eines signifikanten Interaktionsbegriffs zu untersuchen, und diese Antwort hat mir sehr geholfen. Vielen Dank!
Patrick Williams
9

Es hängt wohl davon ab, wofür Sie Ihr Modell verwenden. Aber ich habe noch nie einen Grund gesehen, Modelle mit Haupteffekten nicht auszuführen und zu beschreiben, selbst in Fällen, in denen es bei der Hypothese nur um die Interaktion geht.

Michael Bishop
quelle
Was ist, wenn die Interaktion nur dann von Bedeutung ist, wenn die Haupteffekte nicht im Modell enthalten sind?
Glen
3
@Glen - Es gibt viele Dinge, über die man nachdenken muss, außer über die statistische Signifikanz. Sieh das . Untersuchen Sie besser Ihre Gesamtmodellanpassung (zeichnen Sie Ihre Residuen gegen Ihre Vorhersagen für jedes Modell, das Sie anpassen), Ihre Theorie und Ihre Motivationen für die Modellierung.
Michael Bishop
7

Ich werde einen Absatz aus dem Buch Eine Einführung in die Überlebensanalyse mit Stata von M.Cleves, R.Gutierrez, W.Gould, Y.Marchenko, herausgegeben von Stata Press , ausleihen, um Ihre Frage zu beantworten.

Es ist üblich zu lesen, dass Interaktionseffekte nur dann in das Modell einbezogen werden sollten, wenn die entsprechenden Haupteffekte ebenfalls einbezogen werden. Es ist jedoch nichts Falsches daran, Interaktionseffekte selbst einzubeziehen. [...] Das Ziel eines Forschers ist es, zu parametrisieren, was für die Daten unter Berücksichtigung des vorliegenden Problems mit vernünftiger Wahrscheinlichkeit zutrifft, und nicht nur nach einer Verschreibung.

andrea
quelle
3
Absolut schrecklicher Rat.
Frank Harrell
3
@Frank, würde es Ihnen etwas ausmachen, Ihren Kommentar zu erweitern? Auf den ersten Blick macht es sehr viel Sinn, "zu parametrisieren, was für die Daten mit vernünftiger Wahrscheinlichkeit wahr ist".
Whuber
6
Siehe stats.stackexchange.com/questions/11009/… . Die Daten können Ihnen nicht sagen, was wahr ist, und ein solcher Ansatz hängt stark vom Messursprung für die zu multiplizierenden Variablen ab. Die Beurteilung der Auswirkungen der Temperatur auf die Wechselwirkung in Fahrenheit ergibt ein anderes Bild als bei Verwendung von Celsius.
Frank Harrell
@Frank: Danke, ich habe es gefunden :-). Es ist jetzt Teil dieses Threads.
whuber
7

Sowohl x als auch y werden mit xy korreliert (es sei denn, Sie haben eine bestimmte Maßnahme getroffen, um dies durch Zentrierung zu verhindern). Wenn Sie also mit Ihrem Ansatz einen wesentlichen Interaktionseffekt erzielen, werden sich wahrscheinlich ein oder mehrere Haupteffekte als Interaktion tarnen. Dies wird keine klaren, interpretierbaren Ergebnisse liefern. Was wünschenswert ist, ist stattdessen zu sehen, wie viel die Wechselwirkung darüber hinaus erklären kann, was die Haupteffekte bewirken, indem x , y und (vorzugsweise in einem nachfolgenden Schritt) xy einbezogen werden .

Zur Terminologie: Ja, β 0 wird als "Konstante" bezeichnet. Andererseits hat "partiell" eine bestimmte Bedeutung für die Regression und daher würde ich diesen Begriff hier nicht verwenden, um Ihre Strategie zu beschreiben.

Einige interessante Beispiele, die einmal in einem blauen Mond auftauchen werden, werden in diesem Thread beschrieben .

rolando2
quelle
7

Ich würde vorschlagen, dass es einfach ein Sonderfall von Modellunsicherheit ist. Aus bayesianischer Sicht behandeln Sie dies einfach genauso, wie Sie jede andere Art von Unsicherheit behandeln würden, indem Sie entweder:

  1. Berechnung seiner Wahrscheinlichkeit, wenn es das Objekt von Interesse ist
  2. Integrieren oder mitteln Sie es aus, wenn es nicht von Interesse ist, aber dennoch Ihre Schlussfolgerungen beeinflussen kann

Hint:The interaction between A and B is significant
Ich würde sagen, dass dies die Frage ist, die Sie hier beantworten möchten, obwohl sie nicht genau definiert ist. Und beachte, dass es nicht die verbalen Aussagen wie oben sind, die die Hypothese "definieren", sondern auch die mathematischen Gleichungen. Wir haben einige Daten und vorherige Informationen , dann berechnen wir einfach: (kleine Anmerkung: Egal wie oft ich diese Gleichung aufschreibe, es hilft mir immer, das Problem besser zu verstehen. Seltsam). Die zu berechnende Hauptgröße ist die Wahrscheinlichkeit , dies bezieht sich nicht auf das Modell, daher muss das Modell nach dem Gesetz der Gesamtwahrscheinlichkeit entfernt worden sein: I P ( H i n t | D I ) = P ( H i n t | I ) P ( D | H i n t I )DI
P(Hint|DI)=P(Hint|I)P(D|HintI)P(D|I)
P(D|HintI)
P(D|HintI)=m=1NMP(DMm|HintI)=m=1NMP(Mm|HintI)P(D|MmHintI)
Wobei das m-te Modell indiziert und ist die Anzahl der berücksichtigten Modelle. Der erste Begriff ist das "Modellgewicht", das angibt, wie stark die Daten und vorherigen Informationen das m-te Modell unterstützen. Der zweite Term gibt an, wie sehr das m-te Modell die Hypothese unterstützt. Das Einfügen dieser Gleichung in den ursprünglichen Bayes-Satz ergibt: MmNM
P(Hint|DI)=P(Hint|I)P(D|I)m=1NMP(Mm|HintI)P(D|MmHintI)
=1P(D|I)m=1NMP(DMm|I)P(MmHintD|I)P(DMm|I)=m=1NMP(Mm|DI)P(Hint|DMmI)

Und Sie können daraus dass die "bedingte Schlussfolgerung" der Hypothese unter dem m-ten Modell ist (dies ist normalerweise alles, was für ein ausgewähltes "bestes" Modell in Betracht gezogen wird ). Beachten Sie, dass diese Standardanalyse immer dann gerechtfertigt ist, wenn - ein "offensichtlich bestes" Modell - oder wenn - Alle Modelle geben die gleichen / ähnlichen Schlussfolgerungen. Wenn jedoch keines der beiden Kriterien erfüllt ist, besteht das beste Verfahren nach dem Bayes-Theorem darin, die Ergebnisse zu mitteln und die Modelle zu gewichten, die von den Daten und früheren Informationen am meisten unterstützt werden.P ( M m | D I ) 1 P ( H i n t | D M j I ) P ( H i n t | D M k I )P(Hint|DMmI)P(Mm|DI)1P(Hint|DMjI)P(Hint|DMkI)

Wahrscheinlichkeitslogik
quelle
5

Es ist sehr selten eine gute Idee, einen Interaktionsbegriff ohne die damit verbundenen Haupteffekte aufzunehmen. David Rindskopf von CCNY hat einige Artikel über diese seltenen Fälle geschrieben.

Peter Flom
quelle
5

Es gibt verschiedene Prozesse in der Natur, die nur einen Interaktionseffekt beinhalten, und Gesetze, die sie beschreiben. Zum Beispiel das Ohmsche Gesetz. In der Psychologie haben Sie zum Beispiel das Leistungsmodell von Vroom (1964): Leistung = Fähigkeit x Motivation. Nun können Sie erwarten, einen signifikanten Interaktionseffekt zu finden, wenn dieses Gesetz wahr ist. Leider ist dies nicht der Fall. Es kann leicht vorkommen, dass Sie zwei Haupteffekte und einen unbedeutenden Interaktionseffekt finden (für eine Demonstration und weitere Erklärung siehe Landsheer, van den Wittenboer und Maassen (2006), Social Science Research 35, 274-294). Das lineare Modell eignet sich nicht sehr gut zur Erkennung von Interaktionseffekten. Ohm hätte sein Gesetz vielleicht nie gefunden, wenn er lineare Modelle verwendet hätte.

Die Interpretation von Interaktionseffekten in linearen Modellen ist daher schwierig. Wenn Sie eine Theorie haben, die einen Interaktionseffekt vorhersagt, sollten Sie diesen auch dann einbeziehen, wenn er unbedeutend ist. Möglicherweise möchten Sie Haupteffekte ignorieren, wenn Ihre Theorie diese ausschließt, aber Sie werden es schwierig finden, da bei einem Mechanismus zur Erzeugung echter Daten, der nur einen multiplikativen Effekt hat, häufig signifikante Haupteffekte auftreten.

Meine Antwort lautet: Ja, es kann gültig sein, eine bidirektionale Interaktion in ein Modell aufzunehmen, ohne die Haupteffekte einzubeziehen. Lineare Modelle sind hervorragende Werkzeuge, um die Ergebnisse einer Vielzahl von Datenerzeugungsmechanismen zu approximieren. Ihre Formeln können jedoch nicht einfach als gültige Beschreibung des Datenerzeugungsmechanismus interpretiert werden.

Hans Landsheer
quelle
4

Dieser ist knifflig und mir in meinem letzten Projekt passiert. Ich würde es so erklären: Nehmen wir an, Sie hatten Variablen A und B, die unabhängig voneinander von Bedeutung waren, und Sie hielten eine Interaktion von A und B aus geschäftlicher Sicht für gut. Sie haben die Interaktion einbezogen, die sich als signifikant herausgestellt hat, aber B hat seine Bedeutung verloren. Sie würden Ihr Modell zunächst anhand von zwei Ergebnissen erläutern. Die Ergebnisse würden zeigen, dass B anfangs signifikant war, aber im Lichte von A seinen Glanz verlor. Also ist B eine gute Variable, aber nur im Lichte der verschiedenen Ebenen von A (wenn A eine kategoriale Variable ist). Es ist so, als würde man sagen, Obama sei ein guter Führer, wenn man es im Lichte seiner SEAL-Armee sieht. Das Obama-Siegel wird also eine bedeutende Variable sein. Aber allein gesehen ist Obama vielleicht nicht so wichtig. (Kein Vergehen gegen Obama, nur ein Beispiel.)

Ayush Biyani
quelle
1
Hier ist das Gegenteil der Fall. Die (interessierende) Wechselwirkung ist nur dann von Bedeutung, wenn die Haupteffekte nicht im Modell vorhanden sind.
Glen
3

F = m * a, Kraft ist gleich Masse mal Beschleunigung.

Es wird nicht als F = m + a + ma oder irgendeine andere lineare Kombination dieser Parameter dargestellt. Tatsächlich wäre nur die Wechselwirkung zwischen Masse und Beschleunigung physikalisch sinnvoll.

Nick Michalak
quelle
2
Was für eine unumstößliche physikalische Gleichung gilt, die keinen Raum für Variabilität bietet, muss bei der Modellierung von Daten, die durch Variabilität gekennzeichnet sind, nicht unbedingt zutreffen oder nicht unbedingt zutreffen, genau oder produktiv sein.
Rolando2
2

Interaktion mit und ohne Haupteffekt.  Blau ist eine Bedingung.  Red noch einen.  Ihre jeweiligen Wirkungen werden über drei aufeinanderfolgende Messungen getestet.

Gilt es jemals, eine wechselseitige Interaktion ohne Haupteffekt einzubeziehen?

Ja, es kann gültig und sogar notwendig sein. Wenn Sie zum Beispiel in 2. einen Faktor für den Haupteffekt (durchschnittlicher Unterschied zwischen Blau und Rot) eingeben, würde dies das Modell verschlechtern.

Was ist, wenn es bei Ihrer Hypothese nur um die Interaktion geht, müssen Sie dann noch die Haupteffekte berücksichtigen?

Ihre Hypothese könnte zutreffen, unabhängig davon, ob ein Haupteffekt vorliegt. Das Modell benötigt es jedoch möglicherweise, um den zugrunde liegenden Prozess am besten zu beschreiben. Also ja, du solltest es mit und ohne probieren.

Hinweis: Sie müssen den Code für die "kontinuierliche" unabhängige Variable zentrieren (Messung im Beispiel). Andernfalls werden die Interaktionskoeffizienten im Modell nicht symmetrisch verteilt (kein Koeffizient für die erste Messung im Beispiel).

Sol Hator
quelle
1

Wenn die fraglichen Variablen kategorisiert sind, ist das Einschließen von Interaktionen ohne die Haupteffekte nur eine Neuparametrisierung des Modells. Die Wahl der Parametrisierung hängt davon ab, was Sie mit Ihrem Modell erreichen möchten. Die Interaktion von stetigen Variablen mit anderen stetigen Variablen oder mit kategorialen Variablen ist eine ganz andere Geschichte. Siehe: Siehe diese FAQ vom UCLA-Institut für digitale Forschung und Bildung

David Beede
quelle
1

Ja, dies kann gültig sein, obwohl es selten ist. In diesem Fall müssen Sie jedoch noch die Haupteffekte modellieren, die Sie anschließend zurückführen.

In der Tat ist in einigen Modellen nur die Interaktion interessant, wie z. B. Drogentests / klinische Modelle. Dies ist zum Beispiel die Grundlage des Generalized PsychoPhysiological Interactions (gPPI) -Modells: y = ax + bxh + chWo x/ysind Voxel / Regionen von Interesse und hdie Block- / Ereignisdesigns ?

In diesem Modell werden beide, aund csie werden herausgeregelt, nur bzur Inferenz aufbewahrt (die Beta-Koeffizienten). In der Tat repräsentieren beide aund cin unserem Fall eine unechte Aktivität und repräsentieren nur bdas, was nicht durch unechte Aktivität erklärt werden kann, die Interaktion mit der Aufgabe.

mühsam
quelle
1

Die kurze Antwort: Wenn Sie die Interaktion in die festen Effekte einbeziehen, werden die Haupteffekte automatisch einbezogen, unabhängig davon, ob Sie sie speziell in Ihren Code einbeziehen oder nicht . Der einzige Unterschied ist Ihre Parametrisierung, dh was die Parameter in Ihrem Modell bedeuten (z. B. sind sie Gruppenmittelwerte oder sind sie Unterschiede zu Referenzwerten).

ABA+B+ABAB

YN(ξ,σ2In)XAXBXABξ{XA,XB,XAB}ξ{XAB}{XAB}={XA,XB,XAB}

Ich habe gerade gesehen, dass David Beede eine sehr ähnliche Antwort lieferte (Entschuldigung), aber ich dachte, ich würde dies denen überlassen, die gut auf eine lineare Algebra-Perspektive reagieren.

Ketil BT
quelle