In vielen Algorithmen für maschinelles Lernen ist die Feature-Skalierung (auch bekannt als variable Skalierung, Normalisierung) ein häufiger Vorverarbeitungsschritt. Wikipedia - Feature-Skalierung - Diese Frage war knapp. Frage 41704 - Wie und warum funktionieren Normalisierung und Feature-Skalierung?
Ich habe zwei Fragen speziell in Bezug auf Entscheidungsbäume:
- Gibt es Implementierungen von Entscheidungsbäumen, die eine Feature-Skalierung erfordern würden? Ich habe den Eindruck, dass die Aufteilungskriterien der meisten Algorithmen nicht gleich skalierbar sind.
- Betrachten Sie diese Variablen: (1) Einheiten, (2) Stunden, (3) Einheiten pro Stunde - lassen Sie diese drei Variablen am besten "wie sie sind", wenn sie in einen Entscheidungsbaum eingespeist werden, oder stoßen wir auf einen Konflikt da die "normalisierte" Variable (3) auf (1) und (2) bezogen werden kann? Das heißt, würden Sie diese Situation angreifen, indem Sie alle drei Variablen in den Mix werfen, oder würden Sie normalerweise eine Kombination der drei auswählen oder einfach die Funktion "normalisiert / standardisiert" verwenden (3)?
quelle