Als ich über das Verwenden las StandardScaler
, sagten die meisten Empfehlungen, dass Sie verwenden sollten, StandardScaler
bevor Sie die Daten in Zug / Test aufteilen, aber als ich einige der online veröffentlichten Codes überprüfte (mit sklearn), gab es zwei Hauptverwendungen.
1- Mit StandardScaler
auf alle Daten. Z.B
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_fit = sc.fit(X)
X_std = X_fit.transform(X)
Oder
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X = sc.fit(X)
X = sc.transform(X)
Oder einfach
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_std = sc.fit_transform(X)
2- Verwendung StandardScaler
aufgeteilter Daten.
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X_train = sc.fit_transform(X_train)
X_test = sc.transform (X_test)
Ich möchte meine Daten standardisieren, bin aber verwirrt, welche Methode die beste ist!
quelle
Wie wäre es mit Folgendem:
Denn wenn
X_test = sc.transform(X_test)
, wird ein Fehler zurückgegeben, derX_test
noch nicht angepasst wurde. Oder habe ich hier etwas verpasst?quelle
Sie sollten fit_transform (X_test) nicht für die Testdaten ausführen.
Die Anpassung ist oben bereits aufgetreten.
quelle