Ich würde gerne rennen können
unicode-names 'abç'
und sehen Sie die entsprechenden Unicode-Zeichennamen:
LATIN SMALL LETTER A
LATIN SMALL LETTER B
LATIN SMALL LETTER C WITH CEDILLA
Das Drucken einer Zeichenfolge als eine Reihe von Unicode-Glyphennamen ist in mehreren Fällen hilfreich:
- Unterscheiden Sie leicht verwirrte Zeichen wie "i" und "í".
- Erklären Sie, was eine Literalzeichenfolge tatsächlich enthält (z. B. nicht druckbare oder nicht zugewiesene Zeichen mit einer Breite von Null).
command-line
unicode
l0b0
quelle
quelle
echo -n …— | uniname -bcegpu
Ich kenne keine gute Möglichkeit, dies zu überprüfen
bash
, aber Python verfügt über eine integrierte Unicode-Datenbank, die Sie wie in einem Skript wie diesem verwenden können:Sie können dieses Skript folgendermaßen verwenden (vorausgesetzt, Sie haben es aufgerufen
unicode-names
):Die Datenbank
ValueError
löst eine Ausnahme für Zeichen aus, von denen sie nichts weiß. Daher drucken wir ihre Codepunkte dezimal aus (dies sind normalerweise nicht druckbare Zeichen).Vorsichtsmaßnahme: Das Skript geht davon aus, dass Ihr Terminal UTF-8-codiert ist. Ist dies nicht der Fall, sollten Sie das Argument der
decode()
Methode ändern . Python unterstützt eine sehr große Auswahl an Codierungen, Ihre werden auf jeden Fall dabei sein.quelle
sys.getdefaultencoding()
.