Als «unicode» getaggte Fragen

16
Coreutils, die utf bewusst sind?

Als ich cutheute verwendete, stellte ich fest, dass es ein UTF-8-Zeichen nicht als Zeichen behandelt, sondern 3 Zeichen, weil es 3 Byte lang ist. Dies scheint im Allgemeinen für viele Werkzeuge zu gelten. Gibt es Versionen von coreutilsUTF-8? Meine localeAusgabe: LANG=en_US.UTF-8...

15
Ermittelt die Anzeigebreite einer Zeichenkette

Was wäre der beste Weg, um die Anzeigebreite (mindestens auf einem Terminal, auf dem Zeichen im aktuellen Gebietsschema mit der richtigen Breite angezeigt werden) einer Zeichenfolge aus einem Shell-Skript zu ermitteln? Mich interessiert in erster Linie die Breite von Nicht-Steuerzeichen, aber auch...

14
grep: Finde alle Zeilen, die japanische Kanjis enthalten

In einer riesigen UTF-8-Textdatei möchte ich alle Zeilen anzeigen , die japanische Kanjis enthalten . Welcher grep(oder anderer) Ausdruck macht das? Wenn ich mich nicht irre, sind Kanji die Zeichen zwischen \u4e00und \u4dbf. Ich brauche keine Kanas zu zeigen , aber sie auch zu zeigen , wäre kein...

14
UTF 8 Dateinamen?

Sind in Unix-basierten Betriebssystemen UTF6-Dateinamen zulässig? In diesem Fall muss ich etwas Besonderes tun, um die Datei auf die Festplatte zu schreiben. Lassen Sie mich erklären, was ich zu tun hoffe. Ich schreibe eine Anwendung, die eine Datei über FTP auf ein fernes System überträgt, aber...

13
iconv illegale Eingabesequenz - warum?

Beim Versuch, eine Textdatei in ihr ASCII-Äquivalent zu konvertieren, erhalte ich die Fehlermeldung iconv: illegal input sequence at position. Befehl, den ich benutze, ist iconv -f UTF-8 -t ascii//TRANSLIT file Der beleidigende Charakter ist æ. Die Textdatei selbst ist hier vorhanden . Warum heißt...

12
GNU Screen gibt Unicode-Zeichen nicht korrekt aus

Wenn ich das in meinem Terminal mache: echo -e "\xF0\x9f\x8d\xba" Ich bekomme einen kühlen Bierkrug in mein Terminal: 🍺 Wenn ich jedoch den Bildschirm starte und das Gleiche versuche, erhalte ich ein . Wie bekomme ich den schönen Bierkrug? Dies ist meine .screenrc: nethack on startup_message off...

11
mutt: wie man emoji zeichen richtig anzeigt

Ich würde gerne in der Lage sein, Emoji-Zeichen in Mutt richtig zu sehen, aber z. B. wird 💗 in Mutt's Pager als ^ J angezeigt. Laufen :set pager=view Beim erneuten Öffnen der Nachricht wird das Zeichen mit vim korrekt angezeigt. Die betreffende E-Mail ist PGP-verschlüsselt, aber ich denke, ich...

11
Unterstützung für die utf-8-Codierung mit lpr

Beim Versuch, eine Textdatei über lprvon an den Drucker zu senden xterm, wurde der Inhalt bis zur Unkenntlichkeit beschädigt, dessen Ursache letztendlich auf die Codierung der Datei zurückzuführen war. Wenn ich stattdessen den Text mit iconv(z. B. iconv -f utf-8 -t ascii//TRANSLIT) verarbeite, wird...