Logistische Regression mit binär abhängigen und unabhängigen Variablen
14
Ist es angebracht, eine logistische Regression durchzuführen, bei der sowohl die abhängigen als auch die unabhängigen Variablen binär sind? Zum Beispiel ist die abhängige Variable 0 und 1 und die Prädiktoren sind kontrastcodierte Variablen -1 und 1?
Es gibt keinen Grund, dies nicht zu tun, aber zwei warnende Gedanken:
Behalten Sie den Überblick während der Analyse, welche welche ist. In großen Projekten kann es leicht passieren, dass Sie verloren gehen und fehlerhafte Ergebnisse erzielen.
Wenn Sie sich dafür entscheiden, Regressionsschätzungen anstelle von Quotenverhältnissen zu melden, machen Sie Ihr Codierungsschema in Ihrem Bericht klar , damit die Leser selbst keine ungenauen ORs erstellen , vorausgesetzt, sie wurden beide mit 0,1 codiert.
Mag grundlegend erscheinen, aber ich habe gesehen, dass beide Probleme es in veröffentlichte Veröffentlichungen geschafft haben.
Dann wäre es also auch angebracht, eine Datendatei in sechs Fälle zu unterteilen und einzelne Vergleiche in jedem Datensatz mit eingeschränkten codierten Prädiktoren durchzuführen.
Oberhalb des
Ich bin mir ehrlich gesagt nicht sicher, wonach du fragst. Können Sie klarstellen, was Sie erreichen möchten?
Fomite
Ich habe einen Datensatz mit 3 zwischen und 4 innerhalb der Subjektbedingungen. Ich würde gerne auf jeden einzelnen Effekt testen, aber eine einzelne Regression mit allen Interaktionen lässt eine Menge an Informationen aus, die mich interessieren. Stattdessen würde ich die Daten nach Bedingungen in separate Datensätze aufteilen und für jeden Datensatz eine gezielte logistische Regression mit Kontrast ausführen Codes für die Unterschiede, die mich interessieren.
oben
Weitere Informationen darüber, wie ich die Kontrastcodes codiere, finden
über dem
11
Klarheit: Der Begriff "binär" ist normalerweise nur für 1-gegen-0-Codierung reserviert. Allgemeineres Wort, das für eine 2-Wert-Codierung geeignet ist, ist "dichotom". Dichotome Prädiktoren sind natürlich zur logistischen Regression wie zur linearen Regression willkommen, und da sie nur zwei Werte haben, spielt es keine Rolle, ob sie als Faktoren oder als Kovariaten eingegeben werden.
Normalerweise hilft es bei der Interpretation, wenn Sie Ihre Prädiktoren mit 0-1 codieren, aber abgesehen davon (und der Feststellung, dass dies nicht erforderlich ist) ist daran nichts auszusetzen. Es gibt einige andere (auf Kontingenztabellen basierende) Ansätze, aber wenn ich mich richtig erinnere, stellen sich diese als äquivalent zu (irgendeiner Form von) logistischer Regression heraus.
Kurz gesagt: Ich sehe keinen Grund, dies nicht zu tun.
Vielen Dank! Und wenn ich 3 kontrastcodierte Prädiktoren habe und sie alle 0-1 codiere, sind sie nicht orthogonal. Zum Beispiel habe ich 4 Kategorien und meine drei Codes sind L1: 1, -1,0,0 L2: 0,1, -1,0, L3: 0,0,1, -1. Ist das ein Problem?
über dem
Ihre Beispiel-L-Matrix (L1, L2, L3) besteht aus den wiederholten Kontrasten, bei denen jede Kategorie mit der folgenden Kategorie verglichen wird. Diese Kontrastvorhersagen sind weder orthogonal noch binär (als 0-1 codiert). In der Tat sind ihre Werte 0,75 vs -.25 (1. Variable), 0,5 vs -.5 (2. Variable), 0,25 vs -.75 (3. Variable)
ttnphns
3
Wenn Sie mehr als zwei Prädiktoren haben, ist es außerdem wahrscheinlicher, dass das Problem der Multi-Kollinearität auch bei logistischen oder multiplen Regressionen auftritt. Die Verwendung der logistischen Regression mit allen binären Variablen (dh codiert (0,1)) kann jedoch nicht schaden.
Klarheit: Der Begriff "binär" ist normalerweise nur für 1-gegen-0-Codierung reserviert. Allgemeineres Wort, das für eine 2-Wert-Codierung geeignet ist, ist "dichotom". Dichotome Prädiktoren sind natürlich zur logistischen Regression wie zur linearen Regression willkommen, und da sie nur zwei Werte haben, spielt es keine Rolle, ob sie als Faktoren oder als Kovariaten eingegeben werden.
quelle
Normalerweise hilft es bei der Interpretation, wenn Sie Ihre Prädiktoren mit 0-1 codieren, aber abgesehen davon (und der Feststellung, dass dies nicht erforderlich ist) ist daran nichts auszusetzen. Es gibt einige andere (auf Kontingenztabellen basierende) Ansätze, aber wenn ich mich richtig erinnere, stellen sich diese als äquivalent zu (irgendeiner Form von) logistischer Regression heraus.
Kurz gesagt: Ich sehe keinen Grund, dies nicht zu tun.
quelle
Wenn Sie mehr als zwei Prädiktoren haben, ist es außerdem wahrscheinlicher, dass das Problem der Multi-Kollinearität auch bei logistischen oder multiplen Regressionen auftritt. Die Verwendung der logistischen Regression mit allen binären Variablen (dh codiert (0,1)) kann jedoch nicht schaden.
quelle