Gibt es eine einfache Möglichkeit , alle Nicht-ASCII - Zeichen und die Zeilennummern , auf die sie in einer Datei mit einem Kommandozeilenprogramm wie auftreten zu drucken grep
, awk
, perl
, etc?
Ich möchte die Codierung einer Textdatei von UTF-8 in ASCII ändern, möchte jedoch zuvor alle Instanzen von Nicht-ASCII-Zeichen manuell ersetzen, um unerwartete Zeichenänderungen durch die Dateikonvertierungsroutine zu vermeiden.
LC_ALL=C grep -n -P [$'\x80'-$'\xFF']
Laufen bringen, wo das erste Bit die Kollatierung ausschaltet.Weisen Sie dann Ihr Konvertierungstool an, dies zu tun.
quelle