Insbesondere möchte ich wissen, ob es einen Unterschied zwischen lm(y ~ x1 + x2)
und gibt glm(y ~ x1 + x2, family=gaussian)
. Ich denke, dass dieser spezielle Fall von glm gleich lm ist. Liege ich falsch?
r
normal-distribution
generalized-linear-model
lm
user3682457
quelle
quelle
Antworten:
Während für die spezifische Form des Modells, die im Hauptteil der Frage (dh
lm(y ~ x1 + x2)
vsglm(y ~ x1 + x2, family=gaussian)
) erwähnt wird, Regression und GLMs dasselbe Modell sind, werden in der Titelfrage etwas allgemeinere Fragen gestellt:Darauf lautet die Antwort "Ja!".
Der Grund dafür, dass sie unterschiedlich sein können, besteht darin, dass Sie im GLM auch eine Verknüpfungsfunktion angeben können . Auf diese Weise können Sie bestimmte Formen der nichtlinearen Beziehung zwischen (oder vielmehr dem bedingten Mittelwert) und den Variablen anpassen. Auch wenn Sie dies tun können, brauchen Sie keine Startwerte, manchmal ist die Konvergenz besser (auch die Syntax ist etwas einfacher).y x
nls
Vergleichen Sie zum Beispiel diese Modelle (Sie haben R, ich gehe also davon aus, dass Sie diese selbst ausführen können):
Beachten Sie, dass das erste Paar dasselbe Modell ist ( ) und das zweite Paar dasselbe Modell ist ( und die Anpassungen sind im Wesentlichen innerhalb jedes Paares gleich.yi∼N(β0+β1x1i+β2x2i,σ2) yi∼N(exp(β0+β1x1i+β2x2i),σ2)
In Bezug auf die Titelfrage können Sie also eine wesentlich größere Vielfalt von Gaußschen Modellen mit einer GLM ausrüsten als mit einer Regression.
quelle
MASS::rlm
Kurze Antwort, sie sind genau das gleiche:
Längere Antwort; Die glm-Funktion passt zum Modell von MLE. Aufgrund der Annahme, die Sie bezüglich der Verknüpfungsfunktion getroffen haben (in diesem Fall normal), erhalten Sie jedoch die OLS-Schätzungen.
quelle
glm
istglm(y ~ x1 + x2, family = gaussian(link = "identity"))
.Ausgehend von der Antwort von @ Repmat ist die Modellzusammenfassung dieselbe, aber die CIs der Regressionskoeffizienten von unterscheiden
confint
sich geringfügig zwischenlm
undglm
.lm
während eine normale Verteilung wird verwendet , in ,glm
wenn die Intervalle zu konstruieren.quelle