In vielen Schriften werden Sie in der Tat kaum einen Unterschied feststellen, ob Sie die Unicode-Zeichen für römische Ziffern verwenden oder nur aus lateinischen Sternenbuchstaben zusammensetzen. Das folgende Beispiel zeigt Louis VII
(oben) und Louis Ⅶ
(unten, Codepunkte für römische Ziffern verwendend), die mit FreeSans gerendert wurden:
Abgesehen von einem winzigen Unterschied im Abstand, der vermutlich nicht beabsichtigt war, ist die Ausgabe identisch.
Hier ist der gleiche Text, der mit DejaVu Sans gerendert wurde:
Während die Zeichen immer noch identisch aussehen, gibt es einen beträchtlichen Unterschied im Abstand. Es mag eine Geschmackssache sein, ob letzteres für römische Ziffern bevorzugt wird, aber es wäre sicherlich keine gute Wahl für das Kerning von regulären All-Caps.
Linux Libertine geht noch einen Schritt weiter:
Hier sind die römischen Ziffern etwas kleiner als die Großbuchstaben und stimmen somit mit den arabischen Ziffern der Schrift überein. Am wichtigsten ist, dass sie miteinander verbunden sind und ein Merkmal reproduzieren, das häufig in handgezeichneten römischen Ziffern zu finden ist.
Einige argumentieren vielleicht immer noch, dass es keine Verbesserungen in den oben genannten Punkten gibt oder dass sie die Mühe nicht wert sind. In diesem Fall führt die Nichtverwendung von Unicode-Zeichen zu schrecklichen Ergebnissen:
(Beachten Sie, dass die geringe Größe der Ziffern einen gewissen historischen Schriftsatz widerspiegelt.) Ähnliches kann bei Schrift- oder Kaligraphieschriften auftreten.
Ohne spezielle Unicode-Punkte für römische Ziffern wäre die Lösung des letzteren Problems nur möglich mit:
Verwenden einer komplexen OpenType-Funktion (oder einer ähnlichen Funktion), mit der ermittelt wird, ob eine Folge von Großbuchstaben eine römische Zahl ist. Dies führt unweigerlich zu Problemen mit Wörtern, die auch eine gültige römische Zahl wären.
Mit einer einfachen OpenType-Funktion, die für jede römische Ziffer manuell aktiviert werden muss.
Verwenden des Unicode-Bereichs für den privaten Gebrauch. Kompatibilitätsprobleme treten wahrscheinlich auch dann auf, wenn Sie zwischen zwei Schriftarten wechseln, die beide römische Ziffern unterstützen.
Aus Unicode-Sicht hätte der große semantische Unterschied zwischen lateinischen Großbuchstaben und römischen Ziffern bereits für eine getrennte Kodierung der römischen Ziffern ausreichen müssen.
TL; DR Das Unicode-Konsortium empfiehlt, nach Möglichkeit den lateinischen Buchstaben und nicht die Ziffer zu verwenden, die zur Kompatibilität mit ostasiatischer Typografie enthalten war.
Die ganze Geschichte: (mit Begründung der obigen Behauptung)
Wenn Sie keine ostasiatische Typografie verwenden, ist die Verwendung der (nicht archaischen) römischen Ziffern aus Unicode (U + 2160 - U + 217F) ein Hack.
Diese Zeichen wurden aus Gründen der Kompatibilität mit ostasiatischen Prä-Unicode-Standards eingefügt. Diese Zeichen bleiben vertikal, wenn der ostasiatische Text von oben nach unten gesetzt wird, während in diesem Kontext normalerweise lateinische Zeichen (z. B. Namen) seitwärts geschrieben werden.
So zitieren Sie die letzte Version des Unicode-Standards (v 7.0, Kap. 22, S. 20) :
Theoretisch handelt es sich bei der Unterscheidung zwischen römischen Ziffern und Buchstaben also um Rich Text, wie Kursivschrift, Änderung der Schriftart oder optionale Ligaturen. Das heißt, wie @Wrzlprmft zeigt, verwenden einige Schriftarten es, um eine Änderung der Schriftart für jede römische Ziffer zu vermeiden, während eine gute Typografie beibehalten wird.
Die Existenz eines Zeichens für XII und nicht für XIII impliziert, dass es mehrere verschiedene Kodierungen mit derselben Ziffer gibt, was zu Schwierigkeiten bei der Textsuche führt: Wenn Sie über Louis XII und Louis XIII schreiben, schreiben Sie XIII wahrscheinlich als X + I + I + I, aber wirst du XII als einzelnes Zeichen schreiben? Oder als X + I + I eine konsistente Darstellung mit XIII haben? Bei Verwendung der römischen Ziffern gibt es keine eindeutige Antwort auf diese Frage. Deshalb empfiehlt das Unicode-Konsortium, wenn möglich die lateinischen Buchstaben und nicht die Ziffern zu verwenden.
Bearbeiten: Die TL; DR- Behauptung wurde am Anfang hinzugefügt
quelle
Aus der Perspektive, wie es aussieht, mag es keinen großen Unterschied geben. Wenn Sie also nur gedrucktes Material veröffentlichen, gibt es keinen Unterschied, außer bei einigen Schriftarten, wie Wrzlprmft in seiner ausgezeichneten Antwort hervorhebt.
Semantik ist wichtig
Der semantische Unterschied ist enorm. Durch die Verwendung von römischen Ziffern wird deutlich, dass Sie von der Zahl 5 anstelle des Buchstabens V sprechen. Sicher, sie sehen gleich aus, bedeuten aber etwas anderes. Dies würde bedeuten, dass die Suchmaschine bei der Suche nach "XX version 5" möglicherweise eine höhere Chance hat, "XX mark V" zu finden.
In der Tat ist der Grund, warum einige Dinge schlecht funktionieren, dass wir keine semantischen Informationen einbetten. Die Welt wäre in der Tat ein besserer Ort, wenn wir würden. Die Verwendung der richtigen semantischen Bedeutung entspricht also in etwa der Verwendung von Stilen in einem Textverarbeitungsprogramm im Vergleich zum manuellen Stylen. Am menschlichen Ende gibt es kaum einen Unterschied, aber in der Automatisierung eine große Kraft.
Schriften sollten unterschiedliche römische Ziffern haben
Diese werden von Schriftherstellern nicht wirklich verwendet, da sie nicht sehr häufig verwendet werden. Aber wenn Sie diese verwenden, können Sie die Buchstaben mit den römischen Ziffern versehen, die sie vom Text unterscheiden. Daher wird die Funktion nicht ausreichend genutzt, da sie nur selten genutzt wird. Schriften implementieren nicht wirklich alles und sollten es auch nicht. Wenn Sie diese verwenden, profitieren Sie davon, wenn sie vorhanden sind.
Fazit
Dies alles ist sicherlich ein Henne-und-Ei-Problem. Wenn Personen die Sonderzeichenbereiche nicht verwenden, werden diese Bereiche nicht besonders berücksichtigt. Daher werden speziell gestaltete römische Literale von Schriftarten nicht unterstützt, da dies nur eine Verschwendung von Aufwand für Funktionen bedeutet, die niemand verwendet. Gleiches gilt für die Suche: Wenn niemand römische Literale verwendet, findet keine Suchmaschine römische Literale und die Semantik geht verloren. Die Semantik leidet darunter, dass sie nicht die richtige semantische Bedeutung annimmt. Dasselbe gilt mit Sicherheit auch für einen größeren Bereich von Unicode-Zeichen.
Bezüglich der Komplexität der Eingabe können die meisten Benutzer zwar keine erweiterten Zeichen schreiben, dies ist jedoch keine Entschuldigung für eine sachkundige Person, dies zu überspringen, wenn es sinnvoll ist. Wenn niemand die Dinge verbessert, wird es niemals Fortschritte geben. Zum Teufel sogar Wort hat Modi zum Schreiben von Alpha durch Eingabe von / alpha. Es gibt also wirklich keinen Grund, warum es keinen einfachen Weg geben könnte, Ziffern zu markieren oder sie sogar automatisch als solche vorzuschlagen. Wiederum, wenn niemand dies tut, wird es niemals eine breitere Akzeptanz finden.
quelle
<compat>
entsprechen den entsprechenden Abfolgen lateinischer Buchstaben, was stark darauf hindeutet, dass sie nur aus Gründen der Roundtrip-Kompatibilität mit einigen älteren Zeichensätzen (wahrscheinlich CJK-Zeichensätzen) in Unicode enthalten sind. Solche Zeichen sollten im Allgemeinen nicht verwendet werden, es sei denn, es handelt sich um originalgetreue Rundum-Auslösungsdokumente, die in älteren Codierungen erstellt wurden.