Ich habe 3 Arten von file name
Codierungen auf der reiserfs
gemounteten Festplatte: CP1251, KOI-8, UTF-8 und ASCII. Ich muss wirklich alle Codierungen rekursiv in UTF-8 konvertieren. Gibt es ein Dienstprogramm, das die Quellcodierung erkennt und in UTF-8 konvertiert, oder muss ich ein Python-Skript schreiben?
8
detox
. Es funktionierte für mich zwischen ISO-8859-1 und UTF-8 mit-s iso8859_1-only
Antworten:
Verwenden Sie convmv, ein CLI-Tool, das den Dateinamen zwischen verschiedenen Codierungen konvertiert.
-f
Gehen Sie wie folgt vor, um diese Encondings von (-t
) UTF-8 zu konvertieren :Wenn Sie den Dateiinhalt konvertieren möchten, verwenden Sie außerdem
iconv
ein CLI-Tool, um den Dateiinhalt in verschiedene Codierungen zu konvertieren.-f
Gehen Sie wie folgt vor, um diese Encondings von (-t
) UTF-8 zu konvertieren :quelle
Nee. Einer der großen Nachteile des alten Codepage-Systems ist, dass es keine Möglichkeit gibt, zu erkennen, welches verwendet wird. Sie müssen einfach wissen, dass a priori. Wenn Sie wissen, welche Dateien welche Codierung verwenden, können Sie die Namen folgendermaßen konvertieren:
quelle
chardet
erkennt es irgendwie ...Gleiche Lösung
iconv
wie bei @psusi sugeses, jedoch mit Schleife und while-Karte:Auch Online-Shell-
sh
Skript:Mit Lesen der Karte von der Rohrleitung:
quelle