Als «normalization» getaggte Fragen

209
Standardisieren Sie Datenspalten in R.

Ich habe einen Datensatz namens, spamder 58 Spalten und ungefähr 3500 Datenzeilen enthält, die sich auf Spam-Nachrichten beziehen. Ich habe vor, in Zukunft eine lineare Regression für diesen Datensatz durchzuführen, möchte jedoch vorher eine Vorverarbeitung durchführen und die Spalten so...

129
Worum geht es bei normalisiertem UTF-8?

Das ICU-Projekt (das jetzt auch eine PHP-Bibliothek enthält) enthält die Klassen, die zur Normalisierung von UTF-8-Zeichenfolgen erforderlich sind, um den Vergleich von Werten bei der Suche zu erleichtern. Ich versuche jedoch herauszufinden, was dies für Anwendungen bedeutet . In welchen Fällen...

73
Wie kann ich eine URL in Python normalisieren?

Ich würde gerne wissen, ob ich eine URL in Python normalisiere. Zum Beispiel, wenn ich eine URL-Zeichenfolge wie " http://www.example.com/foo goo / bar.html" habe. Ich benötige eine Bibliothek in Python, die den zusätzlichen Speicherplatz (oder ein anderes nicht normalisiertes Zeichen) in eine...