Ich habe gerade festgestellt, dass ich immer ein Regressionsproblem bearbeitet habe, bei dem die unabhängigen Variablen immer numerisch waren. Kann ich die lineare Regression verwenden, wenn alle unabhängigen Variablen kategorisch sind?
quelle
Ich habe gerade festgestellt, dass ich immer ein Regressionsproblem bearbeitet habe, bei dem die unabhängigen Variablen immer numerisch waren. Kann ich die lineare Regression verwenden, wenn alle unabhängigen Variablen kategorisch sind?
Nur eine Semantik und um es klar zu sagen:
In den meisten Situationen hängt die Art der Regression von der Art der abhängigen, resultierenden oder " " -Variablen ab . Beispielsweise wird die lineare Regression verwendet, wenn die abhängige Variable stetig ist, die logistische Regression, wenn die abhängige mit 2 Kategorien kategorisiert ist, und die multinationale Regression, wenn die abhängige mit mehr als 2 Kategorien kategorisiert ist. Die Prädiktoren können beliebig sein (nominal oder ordinal kategorial oder stetig oder eine Mischung) .
(Die folgende Bemerkung könnte für Sie überflüssig sein, aber ich füge sie trotzdem hinzu.)
Beachten Sie jedoch, dass Sie bei den meisten Programmen kategoriale Prädiktoren in ein binäres numerisches System umcodieren müssen . Dies bedeutet nur, dass das Geschlecht für Frauen auf 0 und für Männer auf 1 kodiert wird oder umgekehrt. Bei kategorialen Variablen mit mehr als 2 Ebenen müssen Sie diese in Dummy-Variablen umcodieren , wobei die Anzahl der Ebenen ist und diese Dummies eine 0 oder 1 enthalten, wenn sie sich in der entsprechenden Kategorie befinden. Auf diese Weise sollte jede Person (Stichprobe) dargestellt werden, indem eine 1 für die Dummy-Variable, zu der sie gehört, und eine 0 für die anderen oder eine 0 für alle Dummies, zu denen sie gehört, zur Referenzgruppe gehört.