Ich muss mich mit einer Datei befassen, die viele unsichtbare Steuerzeichen enthält, wie "von rechts nach links" oder "Nicht-Joiner ohne Breite", andere Leerzeichen als das normale Leerzeichen usw., und ich habe Probleme damit.
Jetzt möchte ich irgendwie alle Buchstaben in einer bestimmten Datei Buchstabe für Buchstabe (ich möchte "von links nach rechts" sagen, aber ich habe es leider mit der Sprache von rechts nach links zu tun) als Unicode-Codepunkte anzeigen und nur verwenden Grund bash - Tools (wie vi
, less
, cat
...). Ist es irgendwie möglich?
Ich weiß, dass ich die Datei hexadezimal anzeigen kann hexdump
, aber ich müsste die Codepunkte neu berechnen. Ich möchte wirklich die tatsächlichen Unicode-Codepunkte sehen, damit ich sie googeln und herausfinden kann, was passiert.
Bearbeiten: Ich werde hinzufügen, dass ich es nicht in eine andere Codierung umcodieren möchte (weil ich das online herausfinde). Ich habe die Datei in UTF8 und das ist in Ordnung. Ich möchte nur die genauen Codepunkte aller Buchstaben kennen.