Ich versuche, meine Faktorspalte in Dummy-Variablen umzuwandeln:
str(cards$pointsBin)
# Factor w/ 5 levels ".lte100",".lte150",..: 3 2 3 1 4 4 2 2 4 4 ...
labels <- model.matrix(~ pointsBin, data=cards)
head(labels)
# (Intercept) pointsBin.lte150 pointsBin.lte200 pointsBin.lte250 pointsBin.lte300
# 741 1 0 0 0 0
# 407 1 1 0 0 0
# 676 1 0 0 1 0
# 697 1 1 0 0 0
# 422 1 0 1 0 0
# 300 1 0 1 0 0
Es gibt keine Spalte für den ersten Wert meines Faktors ( ".lte100"
), als den die erste Zeile kategorisiert werden sollte. Wie bekomme ich diese Daten zurück? Und was bedeutet die Intercept-Spalte, die alle Einsen zu sein scheint?
r
categorical-data
categorical-encoding
Digitgopher
quelle
quelle
- 1
wenn Sie einen einzelnen kategorialen Prädiktor als Faktor darstellen (wie in dieser Frage), davon ausgegangen wird, dass Sie das nicht wirklich meinen und zur Verwendung von sum- wechseln. Codierung auf Null; Das ist natürlich nur eine andere Parametrisierung. Zu freundlich, wenn du mich fragst.Antworten:
Folgendes berücksichtigen:
Die ersten beiden Befehle sind identisch. Die letzten beiden Befehle geben an, dass der Achsenabschnitt nicht erzeugt werden soll, und behalten die beiden erzeugten Dummy-Variablen bei.
quelle