Als «unicode» getaggte Fragen

Unicode ist ein Computer-Industriestandard für die konsistente Codierung, Darstellung und Verarbeitung von Text, der in den meisten Schreibsystemen der Welt ausgedrückt wird.

54
Warum schrumpft printf den Umlaut?

Wenn ich das folgende einfache Skript ausführe: #!/bin/bash printf "%-20s %s\n" "Früchte und Gemüse" "foo" printf "%-20s %s\n" "Milchprodukte" "bar" printf "%-20s %s\n" "12345678901234567890" "baz" Es druckt: Früchte und Gemüse foo Milchprodukte bar 12345678901234567890 baz Das heißt, Text mit...

50
Filterung ungültiger utf8

Ich habe eine Textdatei mit unbekannter oder gemischter Codierung. Ich möchte die Zeilen sehen, die eine Byte-Sequenz enthalten, die nicht für UTF-8 gültig ist (indem ich die Textdatei in ein Programm weitergebe). Entsprechend möchte ich die Zeilen herausfiltern, die für UTF-8 gültig sind. Mit...

16
Finden Sie die beste Schriftart zum Rendern eines Codepunkts

Wie finde ich die passende Schriftart zum Rendern von Unicode-Codepunkten? gnome-terminalStellen Sie fest, dass Zeichen wie "🉃 ⼼ 😻🕲🝤" mit Schriftarten wie "Symbola" und nicht mit meiner Terminalschriftart oder dem Codepoint-in-Square-Fallback (????) gerendert werden können. Wie...

16
Coreutils, die utf bewusst sind?

Als ich cutheute verwendete, stellte ich fest, dass es ein UTF-8-Zeichen nicht als Zeichen behandelt, sondern 3 Zeichen, weil es 3 Byte lang ist. Dies scheint im Allgemeinen für viele Werkzeuge zu gelten. Gibt es Versionen von coreutilsUTF-8? Meine localeAusgabe: LANG=en_US.UTF-8...