Logistische Regression gegen Chi-Quadrat in einer 2x2- und Ix2-Kontingenztabelle (Einzelfaktor - binäre Antwort)?

10

Ich versuche, die Verwendung der logistischen Regression in 2x2- und Ix2-Kontingenztabellen zu verstehen. Verwenden Sie dies beispielsweise als Beispiel

Geben Sie hier die Bildbeschreibung ein

Was ist der Unterschied zwischen der Verwendung des Chi-Quadrat-Tests und der Verwendung der logistischen Regression? Was ist mit einer Tabelle mit mehreren nominalen Faktoren (Ix2-Tabelle) wie folgt:

Geben Sie hier die Bildbeschreibung ein

Es gibt eine ähnliche Frage hier - aber die Antwort ist vor allem , dass Chi-Quadrat - mxn Tabellen umgehen kann, aber meine Frage ist , was für ist specificalyl wenn ein binäres Ergebnis und ein einzelner Nominalfaktor. (Der verknüpfte Thread bezieht sich auch auf diesen Thread , dies betrifft jedoch mehrere Variablen / Faktoren.)

Wenn es sich nur um einen einzelnen Faktor handelt (dh keine Kontrolle für andere Variablen erforderlich ist) mit einer binären Antwort, was ist der Zweckunterschied bei der logistischen Regression?

L Xandor
quelle
+1 für die Frage, aber Sie müssen das Kopieren und Einfügen von Daten erleichtern, um damit arbeiten zu können.
Antoni Parellada
2
Siehe Warum unterscheiden sich meine p-Werte zwischen der logistischen Regressionsausgabe, dem Chi-Quadrat-Test und dem Konfidenzintervall für den OP? . Pearsons Chi-Quadrat-Assoziationstest ist nur der Score-Test für die Nullhypothese, dass alle Steigungen Null sind. Der entsprechende Likelihood-Ratio-Test ist asymptotisch äquivalent. Wie @Kodiologist sagt, sind die Verwendungszwecke der logistischen Regression breiter als das Testen, dass alle Steigungen Null sind.
Scortchi - Monica wieder einsetzen

Antworten:

12

Letztendlich sind es Äpfel und Orangen.

Die logistische Regression ist eine Möglichkeit, eine nominelle Variable als probabilistisches Ergebnis einer oder mehrerer anderer Variablen zu modellieren. Nach dem Anpassen eines logistischen Regressionsmodells kann geprüft werden, ob sich die Modellkoeffizienten signifikant von 0 unterscheiden, Konfidenzintervalle für die Koeffizienten berechnet werden oder untersucht werden, wie gut das Modell neue Beobachtungen vorhersagen kann.

Der χ²-Unabhängigkeitstest ist ein spezifischer Signifikanztest, der die Nullhypothese testet, dass zwei nominale Variablen unabhängig sind.

Ob Sie eine logistische Regression oder einen χ²-Test verwenden sollten, hängt von der Frage ab, die Sie beantworten möchten. Zum Beispiel könnte ein χ²-Test prüfen, ob es unangemessen ist zu glauben, dass die registrierte politische Partei einer Person unabhängig von ihrer Rasse ist, während die logistische Regression die Wahrscheinlichkeit berechnen könnte, dass eine Person mit einer bestimmten Rasse, einem bestimmten Alter und einem bestimmten Geschlecht zu jeder politischen Partei gehört .

Kodiologe
quelle
Vielen Dank. Können Sie mir ein Beispiel für die verschiedenen Arten von Fragen geben, die Sie mit den verschiedenen Methoden beantworten können? Gibt es bestimmte Ressourcen, die Sie empfehlen können, um die verschiedenen Fragen zu verstehen, die mit den beiden Methoden beantwortet werden können?
L Xandor
Ich habe meiner Antwort Beispiele hinzugefügt. In Bezug auf Ihre zweite Frage ist Wikipedia ein guter Ausgangspunkt. In den meisten einführenden Lehrbüchern zur angewandten Statistik wird sowohl der χ²-Test der Unabhängigkeit als auch die logistische Regression erwähnt.
Kodiologe
Vielen Dank. Ich bin mir immer noch nicht sicher, was der Unterschied im speziellen Fall einer 2x2-Kontignenztabelle ist. Chi-Quadrat würde prüfen, ob das Ergebnis unabhängig von den Variationen des Faktors ist, aber was macht die logistische Regression hier? Ich verstehe, dass LR nützlich ist, um Vorhersagen auf der Grundlage einer Reihe von Faktoren zu treffen, aber wenn es um das einfache 2x2 geht, bin ich mir nicht sicher, was der Unterschied ist (aber es wird eindeutig verwendet) ... könnten Sie (oder irgendjemand) das 2x2 verwenden Stress- / Reflux-Tabelle im ursprünglichen Beitrag als konkretes Beispiel dafür, wie sie unterschiedlich verwendet würden? Es ist der Einzelfaktorfall, an dem ich am meisten interessiert bin
L Xandor
oder die Rasse / politische Partei funktioniert genauso gut wie ein Beispiel, aber wenn Sie dann logistische Regression verwenden, verwenden Sie mehrere Faktoren, und ich kann sehen, wie nützlich es dort ist ... aber was ich speziell schwer verstehen kann, ist warum Verwenden Sie LR (oder wie ist es anders) im Einzelfaktorfall. Wenn beide Methoden verwendet werden, um die Beziehung zwischen Rasse und politischer Partei zu untersuchen, was ist der Unterschied zwischen Chi-Quadrat und logistischer Regression?
L Xandor
Im Fall des Beispiels für Stress und Reflux können Sie mithilfe der logistischen Regression testen, ob Stress die Wahrscheinlichkeit eines Reflux signifikant beeinflusst, oder Sie können ein Konfidenzintervall für das Odds Ratio berechnen, das diesen Effekt ausdrückt. Eine Art und Weise, in der sich dies konzeptionell von einem χ²-Test unterscheidet, besteht darin, dass Stress oder Rückfluss als abhängige Variable ausgelegt werden. In jedem Fall kann die logistische Regression für eine 2-mal-2-Kontingenztabelle als übertrieben angesehen werden.
Kodiologe