Ich versuche, die Verwendung der logistischen Regression in 2x2- und Ix2-Kontingenztabellen zu verstehen. Verwenden Sie dies beispielsweise als Beispiel
Was ist der Unterschied zwischen der Verwendung des Chi-Quadrat-Tests und der Verwendung der logistischen Regression? Was ist mit einer Tabelle mit mehreren nominalen Faktoren (Ix2-Tabelle) wie folgt:
Es gibt eine ähnliche Frage hier - aber die Antwort ist vor allem , dass Chi-Quadrat - mxn Tabellen umgehen kann, aber meine Frage ist , was für ist specificalyl wenn ein binäres Ergebnis und ein einzelner Nominalfaktor. (Der verknüpfte Thread bezieht sich auch auf diesen Thread , dies betrifft jedoch mehrere Variablen / Faktoren.)
Wenn es sich nur um einen einzelnen Faktor handelt (dh keine Kontrolle für andere Variablen erforderlich ist) mit einer binären Antwort, was ist der Zweckunterschied bei der logistischen Regression?
quelle
Antworten:
Letztendlich sind es Äpfel und Orangen.
Die logistische Regression ist eine Möglichkeit, eine nominelle Variable als probabilistisches Ergebnis einer oder mehrerer anderer Variablen zu modellieren. Nach dem Anpassen eines logistischen Regressionsmodells kann geprüft werden, ob sich die Modellkoeffizienten signifikant von 0 unterscheiden, Konfidenzintervalle für die Koeffizienten berechnet werden oder untersucht werden, wie gut das Modell neue Beobachtungen vorhersagen kann.
Der χ²-Unabhängigkeitstest ist ein spezifischer Signifikanztest, der die Nullhypothese testet, dass zwei nominale Variablen unabhängig sind.
Ob Sie eine logistische Regression oder einen χ²-Test verwenden sollten, hängt von der Frage ab, die Sie beantworten möchten. Zum Beispiel könnte ein χ²-Test prüfen, ob es unangemessen ist zu glauben, dass die registrierte politische Partei einer Person unabhängig von ihrer Rasse ist, während die logistische Regression die Wahrscheinlichkeit berechnen könnte, dass eine Person mit einer bestimmten Rasse, einem bestimmten Alter und einem bestimmten Geschlecht zu jeder politischen Partei gehört .
quelle