Allgemeines lineares Modell vs. verallgemeinertes lineares Modell (mit einer Identitätsverknüpfungsfunktion?)

25

Dies ist mein erster Beitrag, also mach es mir leicht, wenn ich nicht den Standards folge! Ich habe nach meiner Frage gesucht und es ist nichts aufgetaucht.

Meine Frage bezieht sich hauptsächlich auf die praktischen Unterschiede zwischen der allgemeinen linearen Modellierung (GLM) und der verallgemeinerten linearen Modellierung (GZLM). In meinem Fall wären es ein paar kontinuierliche Variablen als Kovariaten und ein paar Faktoren in einer ANCOVA im Vergleich zu GZLM. Ich möchte die Haupteffekte jeder Variablen sowie eine Drei-Wege-Interaktion untersuchen, die ich im Modell skizzieren werde. Ich kann sehen, dass diese Hypothese in einer ANCOVA oder unter Verwendung von GZLM getestet wird. Bis zu einem gewissen Grad verstehe ich die mathematischen Prozesse und Argumente, die hinter der Ausführung eines allgemeinen linearen Modells wie einer ANCOVA stehen, und ich verstehe ein wenig, dass GZLMs eine Verknüpfungsfunktion ermöglichen, die das lineare Modell und die abhängige Variable verbindet (ok, ich habe gelogen, vielleicht nicht verstehe wirklich die Mathematik). Was ich wirklich anziehe Es ist nicht klar, welche praktischen Unterschiede oder Gründe für die Durchführung einer Analyse sprechen und welche nicht, wenn die im GZLM verwendete Wahrscheinlichkeitsverteilung normal ist (dh Identity-Link-Funktion?). Ich erhalte sehr unterschiedliche Ergebnisse, wenn ich übereinander laufe. Könnte ich auch laufen? Meine Daten sind etwas ungewöhnlich, funktionieren aber teilweise sowohl in der ANCOVA als auch in der GZLM. In beiden Fällen wird meine Hypothese unterstützt, aber im GZLM ist der p-Wert "besser".

Mein Gedanke war, dass eine ANCOVA ein lineares Modell mit einer normalverteilten abhängigen Variablen ist, die eine Identitätsverknüpfungsfunktion verwendet. Genau das kann ich in eine GZLM eingeben, aber diese sind immer noch unterschiedlich.

Bitte beleuchten Sie diese Fragen für mich, wenn Sie können!


Basierend auf der ersten Antwort habe ich die zusätzliche Frage:

Wenn sie mit Ausnahme des verwendeten Signifikanztests (dh F-Test vs. Wald-Chi-Quadrat) identisch sind, welcher wäre am besten geeignet? ANCOVA ist die "Go-to-Methode", aber ich bin nicht sicher, warum der F-Test vorzuziehen wäre. Kann mir jemand etwas Licht in diese Frage bringen? Vielen Dank!

Behacad
quelle
tF

Antworten:

23

Ein verallgemeinertes lineares Modell, das eine Identitätsverknüpfungsfunktion und eine normale Familienverteilung spezifiziert, entspricht genau einem (allgemeinen) linearen Modell. Wenn sich die Ergebnisse merklich voneinander unterscheiden, machen Sie etwas falsch.

Beachten Sie, dass die Angabe eines Identitätslinks nicht mit der Angabe einer Normalverteilung identisch ist. Die Verteilung und die Verknüpfungsfunktion sind zwei verschiedene Komponenten des verallgemeinerten linearen Modells und können unabhängig voneinander ausgewählt werden (obwohl bestimmte Verknüpfungen mit bestimmten Verteilungen besser funktionieren, geben die meisten Softwarepakete die Auswahl der für jede Verteilung zulässigen Verknüpfungen an).

pptFtF Software für verallgemeinerte lineare Modelle kann diese auch als Annäherung verwenden, wenn andere Familien mit einem Skalenparameter ausgestattet werden, der aus den Daten geschätzt wird.

ein Stop
quelle
Danke für Ihre Antwort! Ich freue mich über Ihre Antwort, da dies meine ursprüngliche Annahme war. Ein Professor an meiner Einrichtung sagte mir etwas anderes, also musste ich wirklich graben. Ich verwende SPSS und sehe jetzt, dass die Parameterschätzungen tatsächlich identisch sind (z. B. B-Werte). Ich sehe jetzt, dass mich ursprünglich die verschiedenen p-Werte verwirrt hatten. Die ANCOVA-Statistik basiert auf einem Standard-F-Test, während das GZLM auf dem Wald-Chi-Quadrat basiert. Ich habe gelesen, dass das Wald-Chi-Quadrat verwendet wird, wenn Sie Parameter der Stichprobe verwenden (wie im GZLM).
Behacad
Aufgrund dieser Antwort habe ich dem ursprünglichen Beitrag eine Frage hinzugefügt!
Behacad
Ok, ich habe meiner Antwort einen entsprechenden Absatz hinzugefügt.
21:58
5

Ich möchte meine Erfahrungen in diese Diskussion einfließen lassen. Ich habe gesehen, dass ein verallgemeinertes lineares Modell (das eine Identitätsverknüpfungsfunktion und eine normale Familienverteilung angibt) nur dann mit einem allgemeinen linearen Modell identisch ist, wenn Sie die Maximum-Likelihood-Schätzung als Skalenparameter-Methode verwenden. Andernfalls erhalten Sie bei Auswahl von "Festwert = 1" als Skalenparameter-Methode sehr unterschiedliche p-Werte. Meine Erfahrung zeigt, dass normalerweise "fester Wert = 1" vermieden werden sollte. Ich bin gespannt, ob jemand weiß, wann es angebracht ist, Festwert = 1 als Skalenparameter-Methode zu wählen. Danke im Voraus. Kennzeichen


quelle
3
Typischerweise wird eine feste Skala nur bei Modellen wie der logistischen Regression oder der Poisson-Regression verwendet, bei denen die Antwort eine Zählung oder ein Indikator / eine Frequenzvariable ist. In diesem Fall gibt es bei normaler Regression kein Analogon zum Skalenparameter.
Hong Ooi