Wie in diesem Kurshandbuch (Seite 1) erläutert , kann ein lineares Modell in folgender Form geschrieben werden:
Dabei ist die Antwortvariable und die erklärende Variable .
Mit dem Ziel, Testannahmen zu erfüllen, kann man häufig die Antwortvariable transformieren. Beispielsweise wenden wir die Protokollfunktion auf jedes . Das Transformieren einer Antwortvariablen entspricht NICHT einem GLM.
Ein GLM kann in der folgenden Form geschrieben werden (erneut aus dem Handout des Kurses (Seite 3) )
Wobei nur ein weiteres Symbol für wie ich auf Seite 2 im Handout verstehe. heißt Link-Funktion.
Ich verstehe den Unterschied zwischen einem GLM und einem LM mit transformierter Variable von den Folien im Kurs nicht wirklich. Können Sie mir damit helfen?
Antworten:
So transformieren Sie die Antwort vor einer linearen Regression:
wobei eine gegebene Funktion ist und wir annehmen, dass g ( Y ) eine gegebene Verteilung hat (normalerweise normal).g g(Y)
Ein verallgemeinertes lineares Modell tut dies:
Dabei ist dasselbe wie zuvor und wir nehmen an, dass Y eine gegebene Verteilung hat (normalerweise nicht normal).g Y
quelle
Ich bin mir nicht sicher, ob dies eine vollständige Antwort für Sie sein wird, aber es könnte helfen, den konzeptionellen Stau zu lösen.
Es scheint zwei Missverständnisse in Ihrem Konto zu geben:
Beachten Sie, dass Ordinary Least Squares (OLS - ‚linear‘) Regression ist ein Spezialfall der verallgemeinerten linearen Modells. Wenn Sie also sagen, dass "[t] eine Antwortvariable transformiert, entspricht dies NICHT einer GLM", ist dies falsch. Das Anpassen eines linearen Modells oder das Transformieren der Antwortvariablen und das anschließende Anpassen eines linearen Modells bedeuten beide, eine GLM durchzuführen.
(Ich habe nicht vor, auf Fehlern herumzuspielen, ich vermute nur, dass diese Ihre Verwirrung stiften könnten.)
Es gibt auch einen anderen Aspekt des verallgemeinerten linearen Modells, den Sie nicht erwähnen. Das heißt, wir geben eine Antwortverteilung an. Im Fall der OLS-Regression ist die Antwortverteilung Gauß (normal) und die Verknüpfungsfunktion ist die Identitätsfunktion. Im Fall von beispielsweise logistischer Regression (woran die Leute zuerst denken, wenn sie an GLMs denken) ist die Antwortverteilung das Bernoulli (/ binomial) und die Verknüpfungsfunktion das Logit. Wenn wir Transformationen verwenden, um sicherzustellen, dass die Annahmen für OLS erfüllt sind, versuchen wir oft, die Verteilung der bedingten Antworten akzeptabel zu machen. Eine solche Transformation macht die Bernoulli-Verteilung jedoch nicht annehmbar normal.
quelle