Ungerade Zeichen:
ก็็็็็็็็็็็็็็็็็็็็ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ ก้้้้้้้้้้้้้้้้้้้้ ก็็็็็็็็็็็็็็็็็็็็ ก็็็็็็็็็็็็็็็็็็็็ กิิิิิิิิิิิิิิิิิิิิ
Frage: Warum zeichnen diese Zeichen so merkwürdig, wenn Sie sie in Windows * betrachten?
Hier ist ein Auszug aus Outlook für Ihre glücklichen Bastarde, die nicht gezwungen sind, Windows zu verwenden:
Verwandte: Was ist die verwendete Zeichenkodierung?
* Windows wie im Betriebssystem. Anwendungen, die Text mit GTK + und Ähnlichem zeichnen, zeigen diese nicht wie etwas aus einem LSD-Trip, der schief gelaufen ist .
windows
characters
Marcus Hansson
quelle
quelle
Antworten:
Da ich den Eindruck gewonnen habe, dass Windows "es richtig macht", sollte ich eine Antwort veröffentlichen, um meine Position zu rechtfertigen.
Tatsache ist, dass der Text, den Sie haben, das Betriebssystem anweist, eine verrückte Menge kombinierter Zeichen zu rendern. Das Problem, dass ein Betriebssystem sie tatsächlich rendert, während ein anderes dies nicht tut, ist auf eine Reihe von Problemen zurückzuführen. Eines dieser Probleme ist, wie gründlich die Programmierer waren, als sie den Code geschrieben haben, um sie zu rendern. Ein anderes Problem ist, dass Programmierer zu faul sind, sie, wenn überhaupt, richtig zu implementieren.
Grundsätzlich geht es darum, dass geschriebene Sprachen fließende Dinge sind und dass viele Zeichen in bestimmten Sprachen mehrere verschiedene diakritische Zeichen enthalten , die angewendet werden, um die Aussprache von Zeichen zu ändern. Wie gehen wir mit all diesen diakritischen Zeichen um, geben wir jedem Buchstaben mit einem diakritischen Zeichen ein neues Zeichen (was zu einer Menge neuer und nahezu identischer Zeichen führen würde) oder erstellen wir einen Zeichensatz speziell für diakritische Zeichen und reduzieren unseren Gesamtalphabet?
Unicode gibt uns die Möglichkeit, beides zu tun. Dabei müssen sich die Programmierer, die diese diakritischen Zeichen darstellen müssen, mit der Tatsache auseinandersetzen, dass es einige Zeichen gibt, die tatsächlich mehrere diakritische Zeichen aufweisen, eines darüber und eines darunter, und dann das Programmierprogramm die Frage zu stellen, wann sie aufhören. Sie könnten es auf zwei beschränken und die meisten Menschen zufriedenstellen, aber diejenigen ignorieren, die drei diakritische Zeichen wollen oder brauchen, um formal in ihrer eigenen Sprache zu schreiben.
Microsoft hat zu Recht oder zu Unrecht entschieden, den Benutzer entscheiden zu lassen, wie viele zusätzliche Marken eine Person verwenden möchte. Dieser Weg erfordert einen ziemlich guten Programmierer und einige schwierige Rationalisierungen. Ich unterstütze sie voll und ganz dabei, dies und die Tatsache, dass sie es gut machen, zuzulassen .
Wenn diese Zeichen andererseits fehlen würden, würde ich gerne wissen, warum sie fehlen. War es eine
x
Entscheidung, dass wir dies nach einer diakritischen Entscheidung auf den Boden fallen lassen , oder lag es daran, dass die Programmierer zu faul waren, dies richtig zu tun, und dass ich möglicherweise einem Pufferüberlauf ausgesetzt war, in dem Code, der in der diakritischen Anweisung verborgen war, ohnmächtig wurde, von ausgeführt zu werden das System?Das einfache Problem hierbei ist, dass ich durch das tatsächliche Rendern dieser Zeichen erkennen kann, dass das System genau das tut, was es tun soll, anstatt das zu tun, was es für richtig hält, oder, schlimmer noch, etwas potenziell Schädliches zu tun .
quelle
Weil Windows versucht, eine große Anzahl von Unicode- Kombinationszeichen zu rendern , wenn Ihr Text sie enthält, obwohl kein tatsächliches Skript jemals so viele Zeichen zusammenfügen würde.
quelle