Ich verstehe, was Standard Scalar macht und was Normalizer macht, gemäß der Scikit-Dokumentation: Normalizer , Standard Scaler .
Ich weiß, wann Standard Scaler angewendet wird. Aber in welchem Szenario wird Normalizer angewendet? Gibt es Szenarien, in denen eines dem anderen vorgezogen wird?
python
scikit-learn
data-cleaning
normalization
Heisenbug
quelle
quelle
Antworten:
Sie werden für zwei verschiedene Zwecke verwendet.
StandardScaler
ändert jede Feature- Spalte inNormalizer
ändert jede Stichprobe in wobei fürl1
Norm ist,l2
Norm ist ,max
Norm ist .Betrachten Sie zur Veranschaulichung des Kontrasts den eindimensionalen Datensatz (jeder Datenpunkt hat ein Merkmal). Nach dem Anwenden wird der Datensatz zu . Nach dem Anwenden eines beliebigen Typs wird der Datensatz zu , da das einzige Merkmal durch sich selbst geteilt wird. Hat also keinen Sinn für diesen Fall. Es hat auch keine Verwendung, wenn Merkmale unterschiedliche Einheiten haben, z. B. .{1,2,3,4,5}
{−1.41,−0.71,0.,0.71,1.41}
{1.,1.,1.,1.,1.} (height,age,income)
StandardScaler
Normalizer
Normalizer
Wie in dieser Antwort erwähnt ,
Normalizer
ist dies hauptsächlich nützlich, um die Größe eines Vektors in einem iterativen Prozess zu steuern, z. B. eines Parametervektors während des Trainings, um numerische Instabilitäten aufgrund großer Werte zu vermeiden.quelle
StandardScaler
: Es transformiert die Daten so, dass es einen Mittelwert von 0 und eine Standardabweichung von 1 hat. Kurz gesagt, es standardisiert die Daten . Die Standardisierung ist nützlich für Daten mit negativen Werten. Es ordnet die Daten in einer Standardnormalverteilung an . Es ist bei der Klassifizierung nützlicher als bei der Regression . Sie können diesen Blog von mir lesen .Normalizer
: Es drückt die Daten zwischen 0 und 1 aus. Es führt eine Normalisierung durch . Aufgrund der verringerten Reichweite und Größe explodieren die Gradienten im Trainingsprozess nicht und Sie erhalten keine höheren Verlustwerte. Ist bei der Regression nützlicher als bei der Klassifizierung . Sie können diesen Blog von mir lesen .quelle