Bei der linearen Regression wird davon ausgegangen, dass die Antwortvariable normal verteilt ist. Verallgemeinerte lineare Modelle können Antwortvariablen mit anderen Verteilungen als der Normalverteilung haben - sie können sogar eher kategorial als stetig sein. Sie dürfen also nicht zwischen −∞ und +∞ .
Die Beziehung zwischen der Antwort und den erklärenden Variablen muss nicht einfach linear sein.
Aus diesem Grund benötigen wir die Verknüpfungsfunktion als Komponente des verallgemeinerten linearen Modells. Es verknüpft den Mittelwert der abhängigen Variablen , die E ( Y i ) = μ i ist, mit dem linearen Term x T i β so, dass der Bereich des nicht linear transformierten Mittelwerts g ( μ i ) von reicht - ∞ bis + ∞ . Sie können also tatsächlich eine lineare Gleichung bilden:
g ( μ i ) = x T i βYiE(Yi)=μixTiβg(μi)−∞+∞g(μi)xTiβ
und eine iterativ neu gewichtete Methode der kleinsten Quadrate zur Schätzung der maximalen Wahrscheinlichkeit der Modellparameter verwenden.
Macht die Link-Funktion die Restverteilung normal ?
ABC
@ABC, nein, die Verknüpfungsfunktion verbindet nur den strukturellen Teil des Modells mit (einer Transformation von) dem vorhergesagten Parameter. In einem GLiM müssen Sie auch die Antwortverteilung und die Streuung angeben.
Es kann hilfreich sein, meine Antwort hier zu lesen: Unterschied zwischen logit- und probit-Modellen , in denen GLiM-Links etwas ausführlicher behandelt werden.
quelle