Ich hoffe aufrichtig, dass ich diese Frage so formuliert habe, dass sie definitiv beantwortet werden kann - wenn nicht, lassen Sie es mich bitte wissen und ich werde es erneut versuchen! Ich sollte auch beachten, dass ich R für diese Analysen verwenden werde.
Ich habe mehrere Maßnahmen, von plant performance (Ys)
denen ich vermute, dass sie durch vier von mir verhängte Behandlungen beeinflusst wurden flower thinning (X1), fertilization (X2), leaf clipping (X3)
- und biased flower thinning (X4)
. Für alle möglichen Ys beträgt N mindestens 242, daher waren meine Stichproben groß. Alle Parzellen wurden entweder einer Ausdünnung unterzogen oder nicht, aber jede Parzelle wurde auch einer (und nur einer) der anderen drei Behandlungen unterzogen (oder nicht - es gab auch Kontrollparzellen). Die Idee dieses Designs war es zu testen, ob die anderen drei Behandlungen in der Lage waren, die Auswirkungen der Ausdünnung entweder zu "maskieren" oder zu "verstärken". Daher konnten die letzten drei Behandlungen (X2-X4) nicht miteinander interagieren, da sie nicht gekreuzt wurden, aber sie können jeweils mit der Ausdünnung der Blüten interagieren - und das tun sie wahrscheinlich auch.
Meine expliziten Hypothesen sind, dass 1) die Ausdünnung der Blüte signifikant sein wird und dass 2) die Interaktionsterme X1*X2, X1*X3, and X1*X4,
zwischen der Ausdünnung der Blüte und den anderen drei Behandlungen ebenfalls signifikant sein werden. Das heißt, das Ausdünnen der Blüten sollte eine Rolle spielen, aber die Art und Weise, wie es wichtig ist, sollte durch die anderen drei Behandlungen erheblich verändert werden.
Ich möchte all diese Informationen in ein gemischtes Modell aufnehmen:
Y ~ X0 + X1 + X2 + X3 + X4 + X1*X2 + X1*X3 + X1*X4 + (Up to three random effects)
Aber es gibt ein Problem: Ich habe guten Grund zu der Annahme, dass die Auswirkungen der Ausdünnung auf Y nicht linear sind. Sie sind wahrscheinlich quadratisch, aber in einigen Fällen sogar kubisch. Dies liegt daran, dass die Auswirkungen der Ausdünnung auf die Leistung bei höheren Ausdünnungsgraden sehr wahrscheinlich schneller zunehmen. Wenn ich versuche, diese nichtlineare Beziehung über die obige Gleichung durch Hinzufügen quadratischer und kubischer Terme für X1 zu modellieren, bin ich mir nicht sicher, wie ich die Interaktionsterme modellieren soll - soll ich jede mögliche Kombination von X1, (X1) ^ einschließen 2 und (X1) ^ 3 * X2, X3 und X4? Denn das scheint eine Menge Parameter zu sein, die versucht werden zu schätzen, selbst bei der Anzahl der Datenpunkte, die ich habe, und ich bin mir nicht sicher, wie ich die Ergebnisse interpretieren soll, die ich erhalten würde. Trotzdem habe ich keinen biologischen Grund zu der Annahme, dass dies ein unkluger Weg wäre, die Situation zu modellieren.
Ich habe drei Gedanken, wie ich dieses Problem angehen kann:
- Passen Sie zuerst ein kleineres Modell an, z. B.
Y ~ X1 + X1^2 + X^3 + Random effects
mit dem alleinigen Ziel, herauszufinden, ob die Beziehung zwischen Ausdünnung und Y linear, quadratisch oder kubisch ist, und transformieren Sie dann die Ausdünnung über eine Quadrat- oder Kubikwurzel, um die Beziehung entsprechend zu linearisieren. Von dort aus können die Interaktionsterme wie oben mit der transformierten Variablen modelliert werden.- Nehmen Sie an, dass signifikante Wechselwirkungen, falls sie auftreten, nur einen der X1-Terme betreffen (dh nur den linearen, quadratischen oder kubischen Term), und modellieren Sie die Wechselwirkungen entsprechend. Ich bin mir nicht mal sicher, ob dieser Ansatz Sinn macht.
- Passen Sie einfach das "vollständige Modell" mit jedem möglichen Interaktionsterm zwischen den Ausdünnungsterms und den anderen oben diskutierten Behandlungen an. Schneiden Sie dann unbedeutende Interaktionsterme aus und verwenden Sie Diagramme und andere Techniken, um die Ergebnisse zu interpretieren.
Welcher dieser Ansätze ist, wenn überhaupt, am sinnvollsten und warum, da ich an Hypothesentests und nicht an der Modellauswahl interessiert bin? Insbesondere wenn # 1 oben keinen Sinn ergibt , warum ist das so? Ich habe diesen Artikel und diesen Artikel gelesen und versucht zu verdauen, was sie für mich bedeuten könnten, aber alle Quellen für weitere Lektüre wären auch sehr dankbar!
Ich bin ein Fan von nichtparametrischen Glättungsregressionen, um Funktionsformen von Beziehungen zwischen abhängigen Variablen und Prädiktoren zu bewerten, selbst wenn ich anschließend parametrische Regressionsmodelle schätzen werde. Während ich sehr oft nichtlineare Beziehungen gefunden habe, habe ich nie einen nichtlinearen Interaktionsinteraktionsterm gefunden, selbst wenn die Haupteffekte stark nichtlinear sind. Mein Take-Home: Interaktionseffekte müssen nicht aus denselben Funktionsformen bestehen wie die Prädiktoren, aus denen sie bestehen.
quelle