Als «unicode» getaggte Fragen

81

Fantastische Symbole und Zeichen in einer Bash-Eingabeaufforderung

Ich bin gerade auf einen Screenshot eines Terminals gestoßen: Gibt es eine Liste aller Zeichen, die in einer Bash-Eingabeaufforderung verwendet werden können, oder kann mir jemand das Zeichen für den Stern und den rechten Pfeil geben?

bash prompt unicode

64

Wie kann ich die Stückliste aus einer UTF-8-Datei entfernen?

Ich habe eine Datei in UTF-8-Codierung mit Stückliste und möchte die Stückliste entfernen. Gibt es Linux-Befehlszeilentools, um die Stückliste aus der Datei zu entfernen? $ file test.xml test.xml: XML 1.0 document, UTF-8 Unicode (with BOM) text, with very long lines

command-line files unicode

62

Wie kann ich die Standardcodierung von VIM auf UTF-8 einstellen?

Ich möchte zu einem Open-Source-Projekt beitragen, das übersetzte Zeichenfolgen bereitstellt. Eine ihrer Anforderungen ist, dass Mitwirkende UTF-8 als Kodierung für die PO-Dateien verwenden müssen. Ich verwende VIM 7.3 unter Linux. Wie kann ich sicher sein, dass die VIM-Codierung auf UTF-8...

vim character-encoding unicode

54

Warum schrumpft printf den Umlaut?

Wenn ich das folgende einfache Skript ausführe: #!/bin/bash printf "%-20s %s\n" "Früchte und Gemüse" "foo" printf "%-20s %s\n" "Milchprodukte" "bar" printf "%-20s %s\n" "12345678901234567890" "baz" Es druckt: Früchte und Gemüse foo Milchprodukte bar 12345678901234567890 baz Das heißt, Text mit...

bash unicode printf

50

Filterung ungültiger utf8

Ich habe eine Textdatei mit unbekannter oder gemischter Codierung. Ich möchte die Zeilen sehen, die eine Byte-Sequenz enthalten, die nicht für UTF-8 gültig ist (indem ich die Textdatei in ein Programm weitergebe). Entsprechend möchte ich die Zeilen herausfiltern, die für UTF-8 gültig sind. Mit...

command-line text-processing character-encoding unicode

38

Welche Schriftarten eignen sich für Unicode-Glyphen?

Ich habe mir diese Antwort beim Stackoverflow angesehen und festgestellt, dass meine Schriften nicht das gesamte UTF-8-Unicode-Spektrum abdecken (da ich viele Quadrate erhalte). Kennt jemand eine Schriftart, die den gesamten Beitrag

fonts unicode

36

Wie mache ich tr auf Nicht-ASCII-Zeichen (Unicode-Zeichen) aufmerksam?

Ich versuche, einige Zeichen aus der Datei zu entfernen (UTF-8). Ich benutze trfür diesen Zweck: tr -cs '[[:alpha:][:space:]]' ' ' <testdata.dat Die Datei enthält einige fremde Zeichen (wie "Латвийская" oder "àé"). trscheint sie nicht zu verstehen: es behandelt sie als Nicht-Alpha und entfernt...

linux text-processing unicode tr

36

Sollten wir UTF-8-Zeichen wie ⏰ in Bash / Shell-Skripten verwenden?

Der einfache Code hier funktioniert erwartungsgemäß auf meinem Computer, wenn er mit bashfolgendem Befehl gestartet wird : function ⏰(){ date } ⏰ Könnte es ein Problem für andere geben, die das benutzen, oder ist es universell? Ich frage mich, weil ich so etwas noch nie in einem anderen Quellcode...

bash shell unicode

32

Gibt es eine Alternative zu sed, die Unicode unterstützt?

Zum Beispiel: sed 's/\u0091//g' file1 Im Moment muss ich tun hexdump, um die Hex-Zahl zu bekommen und sedwie folgt zu setzen: $ echo -ne '\u9991' | hexdump -C 00000000 e9 a6 91 |...| 00000003 Und dann: $ sed 's/\xe9\xa6\x91//g' file1

sed unicode hexdump

29

Mein Arch Linux Server wurde aktualisiert und jetzt bekomme ich tmux: brauche das UTF-8-Gebietsschema (LC_CTYPE), habe aber ANSI_X3.4-1968

Ich habe kürzlich meinen Arch Linux-Server aktualisiert und während dieses Vorgangs wurde tmux aktualisiert. Ich habe verwendet, tmuxwährend das Upgrade ausgeführt wurde, und habe es anschließend verwendet, aber alle während derselben SSH-Sitzung. Wenn ich jetzt jedoch versuche, einen tmuxBefehl...

arch-linux tmux locale unicode

27

Wie spezifiziere ich Zeichen mit Hexadezimalcodes in `grep`?

Ich verwende den folgenden Befehl, um den Zeichensatzbereich für den Hexadezimalcode 0900 (anstelle von अ) bis 097F (anstelle von व) zu ermitteln. Wie kann ich hexadezimalen Code anstelle von अ und व verwenden? bzcat archive.bz2 | grep -v '<[अ-व]*\s' | tr '[:punct:][:blank:][:digit:]' '\n' |...

shell grep character-encoding unicode

23

Wie kann ich in bash einen Unicode-Codepoint [0-9A-F] in ein druckbares Zeichen konvertieren?

Ich habe eine Liste von Unicode-Codepunkten, aber ich kenne keine "einfache" Möglichkeit, diese Hex-Werte in die tatsächlichen Zeichen zu konvertieren, die sie darstellen ... Ich habe gehört, dass zsh hat echo -e '\u0965', aber ich benutze Bash 4.1. Gibt es etwas so Einfaches wie die zsh-Methode...

bash unicode

22

Wie schreibe ich "intelligente Anführungszeichen"? (U + 201C, U + 201D)

Es ist wie folgt : “(U + 201C) ”(U +

xorg keyboard special-characters unicode

22

Zwischen Unicode-Normalisierungsformularen in der Unix-Befehlszeile konvertieren

In Unicode haben einige Zeichenkombinationen mehr als eine Darstellung. Beispielsweise kann das Zeichen ä dargestellt werden als "ä", das ist der Codepunkt U + 00E4 (zwei Bytes c3 a4bei UTF-8-Codierung) oder as "ä", das sind die beiden Codepunkte U + 0061 U + 0308 (drei Bytes 61 cc 88in UTF-8)....

command-line text-processing conversion unicode

19

Kann ein Gnome Terminal-Profil standardmäßig UTF-8 verwenden?

Ich bin auf einem Ubuntu-System (glaube ich). Ich habe kein Root-Verzeichnis, daher kann ich das Gebietsschema nicht ändern. Ich möchte, dass mein Standard-Terminalprofil standardmäßig UTF-8 verwendet. Es sollte eine Möglichkeit dafür geben, entweder .gconf/apps/gnome-terminal/irgendwo im...

gnome terminal unicode

18

So überprüfen Sie, ob die Datei eine Stückliste im utf-8-Text enthält

Wie kann ich überprüfen, ob in einer utf-8-Textdatei eine Stückliste von der Befehlszeile aus vorhanden ist? fileBefehl zeigt mir UTF-8 Unicode text. Aber ich weiß nicht, dass die Datei keine Stückliste enthält. Ich benutze Ubuntu

unicode

18

Gibt es eine universelle Möglichkeit, Unicode-Zeichen zu schreiben?

Manchmal möchte ich spezielle Unicode-Zeichen wie einen Bindestrich (-) in verschiedenen Programmen wie vim, Chrome (wie gerade jetzt!) Oder LibreOffice schreiben. In LibreOffice kann ich dies über ein spezielles Dialogfeld im Menü Einfügen erreichen. Andere Programme scheinen keinen eingebauten...

x11 unicode input-method

18

Wie kann ich ein ZIP-Archiv von Dateien mit hebräischen Namen korrekt dekomprimieren?

Jemand hat mir eine ZIP-Datei gesendet, die Dateien mit hebräischen Namen enthält (und unter Windows erstellt wurde, nicht sicher, mit welchem Tool). Ich benutze LXDE auf Debian Stretch. Der Gnome-Archivmanager kann die Datei entpacken, aber die hebräischen Zeichen sind verstümmelt. Ich glaube,...

character-encoding zip unicode file-format

16

Finden Sie die beste Schriftart zum Rendern eines Codepunkts

Wie finde ich die passende Schriftart zum Rendern von Unicode-Codepunkten? gnome-terminalStellen Sie fest, dass Zeichen wie "🉃 ⼼ 😻🕲🝤" mit Schriftarten wie "Symbola" und nicht mit meiner Terminalschriftart oder dem Codepoint-in-Square-Fallback (????) gerendert werden können. Wie...

fonts unicode

16

Coreutils, die utf bewusst sind?

Als ich cutheute verwendete, stellte ich fest, dass es ein UTF-8-Zeichen nicht als Zeichen behandelt, sondern 3 Zeichen, weil es 3 Byte lang ist. Dies scheint im Allgemeinen für viele Werkzeuge zu gelten. Gibt es Versionen von coreutilsUTF-8? Meine localeAusgabe: LANG=en_US.UTF-8...

unicode coreutils cut