In einer Reihe von Statistikpaketen, einschließlich SAS, SPSS und möglicherweise mehr, gibt es eine Option zum "Unterdrücken des Abfangens". Warum willst du das tun?
regression
user333
quelle
quelle
Betrachten Sie den Fall einer 3-stufigen kategorialen Kovariate. Wenn man einen Schnittpunkt hat, würde das 2 Indikatorvariablen erfordern. Bei Verwendung der üblichen Kodierung für Indikatorvariablen ist der Koeffizient für jede Indikatorvariable der mittlere Unterschied zur Referenzgruppe. Wenn Sie den Achsenabschnitt unterdrücken, erhalten Sie 3 Variablen, die die kategoriale Kovariate darstellen, anstatt nur 2. Ein Koeffizient ist dann die mittlere Schätzung für diese Gruppe. Ein konkreteres Beispiel dafür ist die Politikwissenschaft, wo man die 50 Staaten der Vereinigten Staaten studieren kann. Anstatt einen Intercept und 49 Indikatorvariablen für die Zustände zu haben, ist es oft vorzuziehen, den Intercept zu unterdrücken und stattdessen 50 Variablen zu haben.
quelle
Um den Punkt von @Nick Sabbe mit einem konkreten Beispiel zu veranschaulichen.
Ich habe einmal gesehen, wie ein Forscher ein Modell des Alters eines Baumes als Funktion seiner Breite vorstellte. Es ist davon auszugehen, dass der Baum im Alter von null effektiv eine Breite von null hat. Somit ist kein Abfangen erforderlich.
quelle