Ich habe viel gesucht, aber nirgends steht geschrieben, wie man Nicht-ASCII-Zeichen aus Notepad ++ entfernt.
Ich muss wissen, welchen Befehl ich in Suchen und Ersetzen schreiben soll (mit Bild wäre es großartig).
Wenn ich eine weiße Liste erstellen und alle ASCII-Wörter / Zeilen mit einem Lesezeichen versehen möchte, werden Nicht-ASCII-Zeilen nicht markiert
Wenn die Datei ziemlich groß ist und nicht alle ASCII-Zeilen auswählen kann und nur die Zeilen auswählen möchten, die Nicht-ASCII-Zeichen enthalten ...
Encoding->Encode in ANSI
. Konnte nichts anderes finden.Wenn Sie in Notepad ++ zum Menü Suchen → Zeichen im Bereich suchen → Nicht-ASCII-Zeichen (128-255) gehen , können Sie das Dokument zu jedem Nicht-ASCII-Zeichen durchgehen.
Aktivieren Sie unbedingt " Wrap around ", wenn Sie das Dokument für alle Nicht-ASCII-Zeichen durchlaufen möchten.
quelle
Zusätzlich zur Antwort von ProGM können Sie, falls Sie Zeichen in Feldern wie NUL oder ACK sehen und diese entfernen möchten, ASCII-Steuerzeichen (0 bis 31) mit dem folgenden Ausdruck finden und entfernen:
Um alle Nicht-ASCII- UND ASCII-Steuerzeichen zu entfernen, sollten Sie alle Zeichen entfernen, die diesem regulären Ausdruck entsprechen:
quelle
\x00
und\x1F
werden bereits in der Antwort von ProGM abgeglichen.mgsub("[^\x1F-\x7F]+", "", text_vector, fixed = FALSE)
Um alle Nicht-ASCII-Zeichen zu entfernen, können Sie Folgendes ersetzen:
[^\x00-\x7F]+
Um Zeichen hervorzuheben, empfehle ich die Verwendung der Markierungsfunktion im Suchfenster: Dadurch werden Nicht-ASCII-Zeichen hervorgehoben und in die Zeilen, die eines davon enthalten, ein Lesezeichen eingefügt
Wenn Sie stattdessen die ASCII-Zeichen markieren und mit einem Lesezeichen versehen möchten, können Sie dazu den regulären Ausdruck
[\x00-\x7F]
verwenden.Prost
quelle
So behalten Sie neue Zeilen:
Nächster:
Wählen Sie nun die Option Ersetzen Erweitert und ersetzen Sie # durch \ n
:) Jetzt hast du eine saubere ASCII-Datei;)
quelle
Ein weiterer guter Trick besteht darin, in Ihrem Editor in den UTF8-Modus zu wechseln, damit Sie diese lustigen Zeichen tatsächlich sehen und selbst löschen können.
quelle
Ein anderer Weg...
Dies ist schön, wenn Sie sich nicht an den regulären Ausdruck erinnern können oder ihn nicht nachschlagen möchten. Aber der von anderen erwähnte Regex ist auch eine gute Lösung.
quelle