Der Unicode-Zeichensatz enthält das Konzept des Kombinierens von Zeichen :
Kombinationszeichen sind Zeichen, mit denen andere Zeichen geändert werden sollen
Wenn Sie den obigen Text kopieren und mit Notepad ++ anzeigen, erhalten Sie:
Die Textzeichenfolge enthält nicht weniger als 38 Zeichen, wobei die meisten Zeichen kombiniert werden.
Zum Beispiel kann man das Zeichen KOMBINIEREN DES LINKEN HALBEN RINGS OBEN finden,
das aussieht wie:
Diese kombinierten Zeichen, die hauptsächlich für die Verwendung in komplexen asiatischen Sprachen vorgesehen sind, können auch kreativ als Dekoration für lateinische Zeichen verwendet werden, was hier getan wurde.
Ab Unicode 6.2 , Kapitel 2 :
Alle kombinierten Zeichen können auf jedes Basiszeichen angewendet werden und können im Prinzip mit jedem Skript verwendet werden. Wie bei anderen Zeichen identifiziert die Zuordnung eines Kombinationszeichens zu dem einen oder anderen Block nur seine primäre Verwendung; Es ist nicht beabsichtigt, den Zeichenbereich zu definieren oder einzuschränken, auf den es angewendet werden kann. Im Unicode-Standard sind alle Folgen von Zeichencodes zulässig.
Dies verpflichtet die Implementierungen nicht dazu, alle möglichen Kombinationen gleich gut zu unterstützen. Obwohl das Anbringen eines arabischen Anmerkungszeichens auf ein Han-Zeichen oder einen Devanagari-Konsonanten zulässig ist, ist es unwahrscheinlich, dass es beim Rendern gut unterstützt wird oder viel Sinn ergibt.