Ich würde gerne ein lineares Modell (lm) verwenden, bei dem die Varianz der Residuen eindeutig von der erklärenden Variablen abhängt.
Die Art und Weise, wie ich dies weiß, besteht darin, glm mit der Gamma-Familie zu verwenden, um die Varianz zu modellieren, und diese dann in die Gewichte der lm-Funktion umzuwandeln (Beispiel: http://nitro.biosci.arizona.edu/r/chapter31 .pdf )
Ich habe mich gewundert:
- Ist das die einzige Technik?
- Welche anderen Ansätze sind relevant?
- Welche R-Pakete / Funktionen sind für diese Art der Modellierung relevant? (andere als glm, lm)
glm()
dannlm()
in dem Kapitel, auf das Sie verweisen? Mir scheint, dasglm()
ist alles, was dort benötigt und verwendet wird, aber ich habe vielleicht etwas verpasst. Sie können verallgemeinerte kleinste Quadrate (gls()
in nlme ) versuchen, mit denen Gewichtungen geschätzt werden können, um die Art der von Ihnen erwähnten Heteroskedastizität zu steuern. siehe?varFunc
und folge den links von dort. Das IIRCvarFixed()
wird tun, was Sie wollen.Antworten:
Pillen gegen den "Megaphon-Effekt" umfassen (unter anderem):
rlm()
in demMASS
Paket von R führt eine M-Schätzung durch, die robust gegenüber Ungleichheit von Varianzen sein soll.Juli 2017 bearbeiten: Es scheint, dass verallgemeinerte kleinste Quadrate, wie in der Antwort von Greg Snow vorgeschlagen, eine der besten Optionen ist.
quelle
Mit dem gamlss- Paket können Sie die Fehlerverteilung der Antwort als lineare, nicht lineare oder glatte Funktion der erklärenden Variablen modellieren. Dies scheint ein ziemlich wirkungsvoller Ansatz zu sein (ich habe viel über alle Möglichkeiten gelernt , die sich während des Modellauswahlprozesses ergeben könnten), und alles wird in mehreren Veröffentlichungen (einschließlich Büchern), auf die unter dem obigen Link verwiesen wird, gut erklärt.
quelle
Die
gls
Funktion imnlme
Paket für R kann gleichzeitig die Regression und die Beziehung zur Varianz schätzen. Siehe dasweights
Argument und das 2. Beispiel auf der Hilfeseite.quelle