Ich erhalte ein fächerförmiges Streudiagramm der Beziehung zwischen zwei verschiedenen quantitativen Variablen:
Ich versuche, ein lineares Modell für diese Beziehung anzupassen. Ich denke, ich sollte eine Art Transformation auf die Variablen anwenden, um die Aufstiegsvarianz in der Beziehung zu vereinheitlichen, bevor ich ein lineares Regressionsmodell anpasse, aber ich kann den Weg dazu nicht finden. Oder vielleicht gibt es in diesen Fällen ein besseres Modell, ich kann es auch nicht finden.
Ich habe es versucht rlm
, aber die Residuen haben immer noch Heteroskedastizität. Ich habe auch versucht, ein SD-Verhältnis anzuwenden, das aus allen y jedes x und anderen ähnlichen unberechenbaren Ansätzen berechnet wird.
Meine Fragen:
- Gibt es eine typische Möglichkeit, ein Modell für eine fächerförmige Beziehung oder ein typisches Modell für diese Fälle anzupassen?
- Gibt es eine typische Transformation, die auf die Variablen angewendet werden könnte, um deren Varianz zu verringern?
r
regression
heteroscedasticity
scatterplot
Leeodelion
quelle
quelle
gls
jeden Fall ermöglicht die Funktion im Paket nlme die Angabe einer Heteroskedastizitätsstruktur.lm
, aber ich weiß nicht, wie ich sie ausnutzen soll. Ich werde es auch versuchengls
, danke @Roland. Die Beziehung ist für höhere Werte des Prädiktors schwächer, aber ich weiß nicht, wie ich die Heteroskedastizitätsstruktur herausfinden soll, um sie aufweights
die Daten anzuwenden oder sie vorab zu transformieren. Ich bin wirklich verloren damit.Antworten:
Hier sind zwei fächerförmige Diagramme, die mit verschiedenen Methoden erstellt wurden:
(Klicken Sie hier für eine größere Version.)
Diese wiederum schlagen zwei verschiedene Ansätze zur Modellierung von Daten vor, die mehr oder weniger so aussehen:
Nehmen Sie Protokolle und passen Sie ein lineares Modell mit einem auf 1 beschränkten Koeffizienten an (auch als Versatz bezeichnet).
Teilen Sie durch und passen Sie dann ein Nur-Konstanten-Modell an.y x
Es wird andere Möglichkeiten geben, solche Daten zu generieren, und andere Möglichkeiten, solche Daten anzupassen. Einige andere Möglichkeiten sind zum Beispiel:
Passen Sie ein Gamma-Glm mit Identitätsverknüpfung an (und möglicherweise ohne Unterbrechung).
da die Varianz proportional zu istx2 Verwenden Sie diese Tatsache, um eine gewichtete Regression unter Verwendung von Gewichten zu konstruieren, die proportional zu sind 1 /x2 . [Für eine einfache gerade Linie durch den Ursprung sollte dies das gleiche Ergebnis wie 2 ergeben.]
- -
[ AndyWs Kommentar zu einer möglichen fehlenden Kovariate ist wichtig. Ich werde mich jedoch nur mit der Frage der Modellierung fächerförmiger Beziehungen befassen, da dies für sich genommen ein interessantes Thema ist. In der Praxis möchten Sie seinen Vorschlag untersuchen, dass möglicherweise auch potenzielle Kovariaten fehlen. ]]
quelle
x = 0.3
- was für mich so aussieht, als wäre es eine separate Mischung. Erinnert mich ein wenig an das Streudiagramm in meinem Projekt .x2 = sqrt(runif(5000)); y2 = x2*(6-sqrt(rpois(5000,3))); plot(x2,y2,cex=.5,pch=21)