Was ist der beste Weg, um Interaktionen mit kategorialen Merkmalen vorzubereiten, bevor Sie mit scikit-learn arbeiten?
Mit statsmodels
könnte ich bequem im R-Stil sagen smf.ols(formula = 'depvar ~ C(var1)*C(var2)', data=df).fit()
(gleich in Stata mit regress depvar i.var1##i.var2
).
Kann sklearn.preprocessing.PolynomialFeatures
(in v0.15, derzeit dev) mit kategorialen Variablen verwendet werden?
~var1*var2
ist in R vollkommen in Ordnung für die Konstruktion der RHS-Matrix)dmatrix
)Benutze Patsy .
Patsy ist eine meiner Lieblings-Python-Bibliotheken: Es macht eine Sache und nur eine Sache, wirklich sehr, sehr gut.
quelle