Ich lerne Tensorflow und bin auf verschiedene Feature-Spalten gestoßen, die in Tensorflow verwendet werden. Von diesen Typen sind zwei categorical_identity_column
und indicator_column
. Beide wurden auf die gleiche Weise definiert. Soweit ich weiß, konvertieren beide kategoriale Spalten in One-Hot-codierte Spalten.
Meine Frage ist also, was ist der Unterschied zwischen den beiden? Wann soll man das eine und wann das andere benutzen?
quelle
indicator
oderembedded
Spalte umbrochen .In Bezug auf die Frage in den obigen Kommentaren (von Ankit Seth) sagen die Dokumente hier Folgendes über tiefe Modelle (im Gegensatz zu "breit", dh linear):
Wenn Sie versuchen, eine kategoriale Spalte direkt an ein Deep-Modell zu übergeben, gibt TF den folgenden Fehler aus:
quelle