Regression nur mit kategorialen Variablen

24

Ist es möglich, eine Regression durchzuführen, wenn alle abhängigen und unabhängigen Variablen kategorische Variablen sind?

Altruist
quelle
3
Es ist sicherlich möglich, auch für allgemeine oder Garten-Regression, solange die Antwortvariable (abhängig) rein numerisch behandelt wird. Abhängig von Ihrer Software müssen Sie dies möglicherweise forcieren oder erzwingen. Mit einer angemessen weit gefassten Definition von Regression, einschließlich logistischer oder ordinaler Regression, ist dies nicht nur möglich, sondern auch alltäglich.
Nick Cox

Antworten:

31

Wir müssen uns hier über unsere Bedingungen im Klaren sein, aber im Allgemeinen ja :

  • Wenn Ihre abhängige Variable stetig ist (und die Residuen normal verteilt sind - siehe hier ), alle Ihre unabhängigen Variablen jedoch kategorisch sind, ist dies nur eine ANOVA .
  • Wenn Ihre abhängige Variable kategorial ist und Ihre unabhängigen Variablen stetig sind, ist dies eine logistische Regression (möglicherweise binär, ordinal oder multinomial , abhängig).
  • Wenn sowohl Ihre abhängige Variable als auch Ihre unabhängigen Variablen kategoriale Variablen sind, können Sie dennoch die logistische Regression verwenden - dies ist eine Art ANOVA-Version von LR.

Beachten Sie, dass sowohl die logistische Regression als auch die gewöhnliche (lineare) Regression der kleinsten Quadrate Sonderfälle des verallgemeinerten linearen Modells sind .

gung - Wiedereinsetzung von Monica
quelle
Es ist der dritte Fall, den Sie erwähnt haben, ich habe versucht, LR, keiner der Koeffizienten als signifikant befunden. Ich dachte, ich könnte etwas falsch machen.
Altruist
2
Ich glaube nicht , ANOVA erfordert eine kontinuierliche abhängige Variable mehr als es erfordert normalerweise verteilte Residuen. Dies sind nur die Bedingungen, unter denen ANOVA voraussichtlich gut funktioniert.
Nick Cox
1
@ NickCox, Sie haben natürlich Recht; Wir streiten darüber, wie wir diese Begriffe definieren und anwenden. Ich würde sagen, dass das Modell von diesen Annahmen abgeleitet ist, aber die ANOVA kann verwendet werden, auch wenn sie nicht erfüllt sind, mit der Frage, ob die Ergebnisse hilfreich sind.
gung - Wiedereinsetzung von Monica
1
@altruist, ich habe die drei Fälle aus Gründen der begrifflichen Klarheit dargelegt; Ich erkenne, dass das Letzte das ist, was du willst. Beachten Sie, dass es unabhängig davon ist, ob Sie die Software für die Anpassung an das Modell verwenden oder nicht und ob Ihre Koeffizienten "signifikant" sind oder nicht.
gung - Wiedereinsetzung von Monica
4
Beachten Sie, dass Kategorisierung manchmal eine Frage der Definition für die Software ist und manchmal im Kopf des Betrachters. Wie viele Kinder gibt es zum Beispiel?
Nick Cox