Hat jedes logarithmische lineare Modell eine vollkommen äquivalente logistische Regression?

8

Ich versuche, ein logarithmisch lineares Modell an eine große Anzahl von Variablen aus Umfragedaten anzupassen. Es gibt einige Gründe, warum es möglicherweise vorzuziehen ist, stattdessen logistische Regressionen an diese Daten anzupassen. Mehrere Behörden schlagen vor, dass diese gleichwertig sind. Ich habe jedoch einige Gründe, dies zu bezweifeln.

  1. Log-lineare Modelle behandeln alle Variablen gleich, während die logistische Regression erfordert, dass eine Variable als Antwortvariable identifiziert wird.
  2. Im Kontext der kleinsten Quadrate ist es im Allgemeinen nicht der Fall, dass für Y = a + bX + & epsi; gegenüber X = c + dY + & epsi; der Parameter d sogar ungefähr gleich 1 / b ist. Dies liegt daran, dass die erste Gleichung den vertikalen Fehler minimiert, während die zweite den horizontalen Fehler minimiert. Diese sind nur dann gleich, wenn die Fehler um die geschätzte Linie symmetrisch sind. Ich mache mir also Sorgen, dass dies auch für die logistische Regression gilt. (2) ist eigentlich nur eine bestimmte Form von (1), dh eine mögliche Asymmetrie im Regressionsformat aus der Wahl einer bestimmten Variablen als Antwort.

  3. Wenn alle Variablen im logarithmischen linearen Modell an einem oder mehreren Interaktionstermen beteiligt sind, sehe ich nicht, wie eine logistische Regression äquivalent sein kann. Wie würde man die Interaktionen ausdrücken, an denen die Antwortvariable im Kontext einer logistischen Regression beteiligt ist?

Als Antwort auf Bill Huber verwende ich den Begriff log-lineares Modell in einem wesentlich engeren Sinne als Wikipedia. Ich beziehe mich auf Modelle von kategorialen oder ordinalen Zähldaten, die in Tabellen angeordnet sind, wobei die Koeffizienten die Gesamtzahl der Tabellen, die Grenzzahlen für jeden Faktor geteilt durch die Gesamtzahl der Tabellen (die als Stellvertreter für Wahrscheinlichkeiten dienen) und verschiedene Interaktionsterme sind. Dies ist der Sinn, der unter anderem in Agresti, „Categorical Data Analysis“, verwendet wird.

andrewH
quelle
Mein Verständnis des "loglinearen Modells", das ziemlich gut mit der Wikipedia-Definition übereinstimmt , wenn auch etwas allgemeiner, ermöglicht es mir nicht, diese Frage zu verstehen. Könnten Sie uns bitte sagen, was dieser Begriff für Sie bedeutet?
whuber
2
Wikipedia nennt es loglineare Analyse: en.wikipedia.org/wiki/Loglinear_analysis
Jeremy Miles
1
Es gibt verschiedene Formen der loglinearen Analyse - allgemein, logit usw. Die loglineare Logit-Analyse ist für Situationen gedacht, in denen Sie abhängige Variablen und einige Prädiktoren haben. Soweit ich weiß, ergibt sich das gleiche Ergebnis (Parameterschätzungen) wie bei der nominalen logistischen Regression.
ttnphns

Antworten:

4

Die Antwort ist nein'. Das loglineare Modell ist allgemeiner als das logistische Regressionsmodell. Siehe Fienberg, 1980, Analyse klassifizierter kategorialer Daten, Abschnitt 6.2, wie ein loglineares Modell so spezifiziert wird, dass es der logistischen Regression entspricht.

Eigentlich ist das Gegenteil der Fall: Wenn alle Variablen kategorisch sind, entspricht jedes logistische Regressionsmodell einem loglinearen Modell.

Stef van Buuren
quelle
Das habe ich mir gedacht, aber nicht das, was ich mir erhofft hatte. In R, dem Hauptwerkzeug, das ich verwende, gibt es mehrere Pakete oder verfügbare Routinen, um das komplexe Stichprobenmuster für die lm- und GLM-Modelle anzupassen. Ich habe nichts Äquivalentes für logarithmisch lineare Modelle gefunden.
Andrew
Ich weiß nicht, ob es für Ihre Zwecke nützlich ist, aber die Funktion loglm () von MASS kann für logarithmische lineare Modelle geeignet sein. Vielleicht möchten Sie auch das ACD-Paket auschecken.
Stef van Buuren
Mit einem Poisson GLM können Sie auch logarithmisch lineare Modelle anpassen. Siehe Agresti: Kategoriale Datenanalyse, Abschnitt 8.6.7.
Momo