Warum benötigen Sie unterschiedliche Schriftarten für verschiedene Sprachen?
CSV steht für durch Kommas getrennte Werte. Und das ist einfach so. Dies ist ein Text, dessen Werte durch Kommas getrennt sind (oder in einigen Versionen Semikolons oder andere Trennzeichen). Es ist im Grunde eine reine Textdatei und kann mit einem Texteditor geöffnet und bearbeitet werden.
Rich-Text-Formate können Meta-Informationen enthalten, z. B. welche Schriftart verwendet werden soll. Eine reine Textdatei enthält wirklich Text und nichts anderes . Das CSV-Format bietet keinen Ort, an dem Schriftartinformationen gespeichert werden können.
Eine CSV-Datei kann zwar keine Zeichensatzinformationen enthalten, sie kann jedoch grundsätzlich in einer beliebigen Textcodierung vorliegen 1 . Im Prinzip kann Ihre CSV-Datei daher in einer Unicode-Kodierung wie UTF-8 oder UTF-16 gespeichert werden. Im Prinzip wird dies funktionieren. Unicode-Kodierungen umfassen alles, was andere Kodierungen umfassen. Wenn es sich um Text handelt, der auf einem Computer dargestellt werden kann, kann er in Unicode dargestellt werden. Ihr CSV-Editor entscheidet, welche Schriftart verwendet werden soll. Wenn es anständig ist, wird er wahrscheinlich eine passende Schrift auswählen. Wenn die Datei beispielsweise Zeichen enthält, die in der Standardschriftart nicht enthalten sind, wird für diese Zeichen automatisch eine andere Schrift verwendet.
In der Praxis wird dies wahrscheinlich mit Libre Office oder OpenOffice funktionieren, aber Microsoft Excel mag CSV-Dateien nicht in anderen Kodierungen als Latin-1 und kann auch nicht gut mit ihnen spielen. Dies ist ein Fehler in Microsoft Office.
Abhilfemaßnahme 1: Verwenden Sie Libre Office oder OpenOffice.
Abhilfemaßnahme 2: Generieren Sie einen durch Tabulatoren getrennten Unicode 2 Datei, als vorgeschlagen von Matt Champion .
1 Nun, jede Textcodierung, die ein Kommazeichen enthält. ASCII enthält ein Komma, und die meisten anderen Textkodierungen bestehen aus ASCII-Obermengen, es gibt jedoch eine oder zwei Kodierungen, die kein Komma enthalten. Binäres SignWriting ist ein Beispiel.
2 Unicode ist eigentlich eine breite Familie von Kodierungen und keine Kodierung. Was Microsoft als "Unicode" bezeichnet, ist eigentlich UTF-16 LE, eine der Unicode-Kodierungen.