Ich versuche xgboost in scikit learn auszuführen. Und ich benutze Pandas nur, um Daten in den Datenrahmen zu laden. Wie soll ich pandas df mit xgboost verwenden? Ich bin verwirrt von der DMatrix-Routine, die zum Ausführen von xgboost algo erforderlich ist.
scikit-learn
pandas
xgboost
Geist in der Muschel
quelle
quelle
xgb.DMatrix(X_train.values, y_train.values)
ich es so versuche, sehe ichTypeError: can not initialize DMatrix from dict
.values
)Es gibt einige gute Neuigkeiten, es gibt eine Bibliothek
pandas_ml
, die XGBoost unterstützt, wahrscheinlich wird dies den Workflow einfach rationalisieren.http://pandas-ml.readthedocs.io/en/latest/xgboost.html
quelle
Sie können Pandas DataFrames jetzt direkt mit XGBoost verwenden. Funktioniert definitiv mit xgboost 0.81.
Beispiel: X_train, X_val, y_train und y_val sind DataFrames:
quelle