Wie soll ich Interaktionen zwischen erklärenden Variablen modellieren, wenn eine von ihnen quadratische und kubische Terme haben kann?

Ich hoffe aufrichtig, dass ich diese Frage so formuliert habe, dass sie definitiv beantwortet werden kann - wenn nicht, lassen Sie es mich bitte wissen und ich werde es erneut versuchen! Ich sollte auch beachten, dass ich R für diese Analysen verwenden werde.

Ich habe mehrere Maßnahmen, von plant performance (Ys)denen ich vermute, dass sie durch vier von mir verhängte Behandlungen beeinflusst wurden flower thinning (X1), fertilization (X2), leaf clipping (X3)- und biased flower thinning (X4). Für alle möglichen Ys beträgt N mindestens 242, daher waren meine Stichproben groß. Alle Parzellen wurden entweder einer Ausdünnung unterzogen oder nicht, aber jede Parzelle wurde auch einer (und nur einer) der anderen drei Behandlungen unterzogen (oder nicht - es gab auch Kontrollparzellen). Die Idee dieses Designs war es zu testen, ob die anderen drei Behandlungen in der Lage waren, die Auswirkungen der Ausdünnung entweder zu "maskieren" oder zu "verstärken". Daher konnten die letzten drei Behandlungen (X2-X4) nicht miteinander interagieren, da sie nicht gekreuzt wurden, aber sie können jeweils mit der Ausdünnung der Blüten interagieren - und das tun sie wahrscheinlich auch.

Meine expliziten Hypothesen sind, dass 1) die Ausdünnung der Blüte signifikant sein wird und dass 2) die Interaktionsterme X1*X2, X1*X3, and X1*X4,zwischen der Ausdünnung der Blüte und den anderen drei Behandlungen ebenfalls signifikant sein werden. Das heißt, das Ausdünnen der Blüten sollte eine Rolle spielen, aber die Art und Weise, wie es wichtig ist, sollte durch die anderen drei Behandlungen erheblich verändert werden.

Ich möchte all diese Informationen in ein gemischtes Modell aufnehmen:

Y ~ X0 + X1 + X2 + X3 + X4 + X1*X2 + X1*X3 + X1*X4 + (Up to three random effects)

Aber es gibt ein Problem: Ich habe guten Grund zu der Annahme, dass die Auswirkungen der Ausdünnung auf Y nicht linear sind. Sie sind wahrscheinlich quadratisch, aber in einigen Fällen sogar kubisch. Dies liegt daran, dass die Auswirkungen der Ausdünnung auf die Leistung bei höheren Ausdünnungsgraden sehr wahrscheinlich schneller zunehmen. Wenn ich versuche, diese nichtlineare Beziehung über die obige Gleichung durch Hinzufügen quadratischer und kubischer Terme für X1 zu modellieren, bin ich mir nicht sicher, wie ich die Interaktionsterme modellieren soll - soll ich jede mögliche Kombination von X1, (X1) ^ einschließen 2 und (X1) ^ 3 * X2, X3 und X4? Denn das scheint eine Menge Parameter zu sein, die versucht werden zu schätzen, selbst bei der Anzahl der Datenpunkte, die ich habe, und ich bin mir nicht sicher, wie ich die Ergebnisse interpretieren soll, die ich erhalten würde. Trotzdem habe ich keinen biologischen Grund zu der Annahme, dass dies ein unkluger Weg wäre, die Situation zu modellieren.

Ich habe drei Gedanken, wie ich dieses Problem angehen kann:

Passen Sie zuerst ein kleineres Modell an, z. B. Y ~ X1 + X1^2 + X^3 + Random effectsmit dem alleinigen Ziel, herauszufinden, ob die Beziehung zwischen Ausdünnung und Y linear, quadratisch oder kubisch ist, und transformieren Sie dann die Ausdünnung über eine Quadrat- oder Kubikwurzel, um die Beziehung entsprechend zu linearisieren. Von dort aus können die Interaktionsterme wie oben mit der transformierten Variablen modelliert werden.

Nehmen Sie an, dass signifikante Wechselwirkungen, falls sie auftreten, nur einen der X1-Terme betreffen (dh nur den linearen, quadratischen oder kubischen Term), und modellieren Sie die Wechselwirkungen entsprechend. Ich bin mir nicht mal sicher, ob dieser Ansatz Sinn macht.

Passen Sie einfach das "vollständige Modell" mit jedem möglichen Interaktionsterm zwischen den Ausdünnungsterms und den anderen oben diskutierten Behandlungen an. Schneiden Sie dann unbedeutende Interaktionsterme aus und verwenden Sie Diagramme und andere Techniken, um die Ergebnisse zu interpretieren.

Welcher dieser Ansätze ist, wenn überhaupt, am sinnvollsten und warum, da ich an Hypothesentests und nicht an der Modellauswahl interessiert bin? Insbesondere wenn # 1 oben keinen Sinn ergibt , warum ist das so? Ich habe diesen Artikel und diesen Artikel gelesen und versucht zu verdauen, was sie für mich bedeuten könnten, aber alle Quellen für weitere Lektüre wären auch sehr dankbar!

hypothesis-testing mixed-model interaction nonlinear regression-strategies Bajcz
quelle

Antworten:

Keiner dieser Ansätze funktioniert ordnungsgemäß. Ansatz 3. kam nahe, aber dann sagten Sie, Sie würden unbedeutende Begriffe herausschneiden. Dies ist problematisch, da Co-Linearitäten es unmöglich machen, die zu entfernenden Begriffe zu finden, und weil dies Ihnen bei Hypothesentests die falschen Freiheitsgrade geben würde, wenn Sie den Fehler vom Typ I beibehalten möchten.

rms $Y$

# Fit a model with splines in x1 and x2 and tensor spline interaction surface
# for the two.  Model is additive and linear in x3.
# Note that splines typically fit better than ordinary polynomials
f <- ols(y ~ rcs(x1, 4) * rcs(x2, 4) + x3)
anova(f)   # get all meaningful hypothesis tests that can be inferred
           # from the model formula
bplot(Predict(f, x1, x2))    # show joint effects
plot(Predict(f, x1, x2=3))   # vary x1 and hold x2 constant

Wenn Sie die anovaTabelle sehen, sehen Sie beschriftete Linien, All Interactionsdie für das gesamte Modell den kombinierten Einfluss aller Interaktionsterme testen. Für einen einzelnen Prädiktor ist dies nur hilfreich, wenn der Prädiktor mit mehr als einer Variablen interagiert. In der printMethode gibt es eine Option anova.rms, um durch jede Zeile in der Tabelle genau anzuzeigen, welche Parameter gegen Null getestet werden. All dies funktioniert mit Mischungen aus kategorialen und kontinuierlichen Prädiktoren.

Wenn Sie gewöhnliche Polynome verwenden möchten, verwenden Sie polanstelle von rcs.

Leider habe ich keine Modelle mit gemischten Effekten implementiert.

Frank Harrell
quelle

Danke für diese Antwort. Ich habe noch nie Splines verwendet, aber ich glaube, ich verstehe Ihr Beispiel. Ich habe ein paar Anschlussfragen, ob das in Ordnung ist? 1. Wenn Sie die Anova-Ergebnisse von ols betrachten, wie in Ihrem Beispiel, was bedeutet "Alle Interaktionen" unter einem Faktor? Das heißt, alle Interaktionen mit was? 2. Wird ein ähnlicher Ansatz bei einem Ansatz mit gemischter Modellierung zulässig sein? Ich glaube, ich brauche keine zufälligen Faktoren. Ist Ihr Beispiel beispielsweise mit lme4 kompatibel? 3. Funktioniert dies, wenn einige der interagierenden Behandlungen kategorisch sind? Was wäre zum Beispiel, wenn X2 ein 2-Level-Faktor wäre?

Bajcz

Ich bin ein Fan von nichtparametrischen Glättungsregressionen, um Funktionsformen von Beziehungen zwischen abhängigen Variablen und Prädiktoren zu bewerten, selbst wenn ich anschließend parametrische Regressionsmodelle schätzen werde. Während ich sehr oft nichtlineare Beziehungen gefunden habe, habe ich nie einen nichtlinearen Interaktionsinteraktionsterm gefunden, selbst wenn die Haupteffekte stark nichtlinear sind. Mein Take-Home: Interaktionseffekte müssen nicht aus denselben Funktionsformen bestehen wie die Prädiktoren, aus denen sie bestehen.

Alexis
quelle

Um dies zu verdeutlichen, können Sie mit nach Hause nehmen, dass ich, wenn ich Option 2 wähle, sicher nur Interaktionsterme in den linearen X1-Term einfügen kann und mich nicht um "Interaktionsterme höherer Ordnung", z. B. X1 ^ 2 * X3 usw., kümmern muss.

Bajcz

@Bajcz Nun ... ich denke, ich sage zwei Dinge: (1) Ich habe es geschafft, in den Datensätzen auszukommen, die ich bei rein linearen Interaktionen erlebt habe, aber auch (2) ich schaue gerne (unter Verwendung nichtparametrischer Regressionen) und lassen Sie sich von den Daten sagen, ob ich nichtlineare Alternativen in Betracht ziehen sollte oder nicht. [Ein Modellanpassungs- oder Hypothesentestansatz für nichtlineare Terme ist IMO der falsche Weg, da dies beispielsweise eine Inferenz beinhaltet, die beispielsweise auf einem beliebigen Satz von Polynomtermen basiert und nicht auf den Daten selbst.]

Alexis

Es gibt keinen großen Grund zu der Annahme, dass Interaktionen eher linear sind. Ich bin auf großartige Beispiele für nichtlineare Wechselwirkungen gestoßen. Die Idee, "zu schauen" und "sich von den Daten erzählen zu lassen", ist mit Inferenzproblemen behaftet, einschließlich Problemen mit der Abdeckung von Intervallen mit schlechtem Vertrauen.

Frank Harrell

@FrankHarrell Danke! Ihr erster Satz ist genau der Punkt, den ich in meinem (2) im obigen Kommentar zu vermitteln versucht habe (meine bisherigen Erfahrungen können in Zukunft dramatisch variieren). OTOH: Die Daten nicht sprechen zu lassen, ist eine großartige Strategie, um Rückschlüsse auf Artefakte von Modellierungsannahmen auf Rückschlüsse auf die tatsächlichen Daten zu übertragen.

Alexis