Ich benutze Windows XP. Ich suche nach einem Tool, das für ein bestimmtes Verzeichnis alle Dateien mit einer bestimmten Zeichenkodierung findet (wie UTF-8). Kennen Sie ein solches Werkzeug?
search
software-rec
encoding
Dawid Ohia
quelle
quelle
Antworten:
Dieses Tool funktioniert hervorragend. Hör zu. Es werden alle Dateien und ihre Codierungen für einen Ordner angezeigt.
http://encodingchecker.codeplex.com/releases/view/59420
Dies gilt auch für das Ändern von Dateien in UTF8.
http://www.rotatingscrew.com/utfcast.aspx
quelle
Im Allgemeinen ist dies nicht möglich - abgesehen vom Sonderfall von UTF-8-Textdateien mit einem Byte Order Mark. Da der Name der Codierung nicht in der Textdatei gespeichert ist, besteht die einzige Möglichkeit, beispielsweise CP437 von CP850 zu unterscheiden, darin, auf der Grundlage einer statistischen Analyse der gesamten Datei eine Vermutung anzustellen und die Häufigkeit bestimmter Zeichenpaare usw. zu untersuchen.
Solaris-Benutzer haben auto_ef, aber meines Wissens gibt es keinen Windows-Port.
Perl-Benutzer haben Encode :: Guess
Laut Wikipedia "Die neueren Versionen des Befehls unix File versuchen, die Zeichenkodierung grundlegend zu erkennen (auch auf Cygwin und Mac verfügbar)."
Keiner der oben genannten Punkte ist 100% zuverlässig. Wenn Ihre Dateien definitiv alle in einer von wenigen bekannten Codierungen enthalten sind, können Sie dies möglicherweise besser machen.
quelle
Unter Windows ist dies möglich, indem nach der richtigen Stücklistenreihenfolge (Byte Order Mark, BOM) gesucht wird, sofern die Dateien mit einer Stückliste erstellt wurden.
Dafür benötigen Sie ein Suchprogramm.
Eine Möglichkeit ist Grep für Windows und die Suche mit dem Dateibetreiber (^^).
quelle