Sprachen, die von "lateinischen" oder "lateinisch erweiterten" Glyphen in Schriftarten in Google Web Fonts unterstützt werden?

69

Google Web Fonts Wählen Sie Zeichensätze aus

Einige Schriftarten in Google Web Fonts unterstützen mehrere "Zeichensätze". Die Sache ist, wenn die von mir verwendete Webschrift nur die "lateinischen" Glyphen bedient, werden Benutzer, die die Seite in eine Sprache übersetzen, deren Glyphen nicht unterstützt werden, den fehlerhaften Text deutlich bemerken.

Ich möchte, dass meine Web-Schriftarten neben Englisch die beliebtesten Sprachen der Welt unterstützen, z. B. Spanisch, Deutsch, Französisch usw.

Zu diesem Zweck möchte ich wissen, welche Sprachen genau "lateinisch" und "lateinisch erweitert" individuell bedienen.

Ich erwarte, dass die Antwort so aussieht:

Latin Character Set & Supported Languages:

- ..........
- ..........
- ..........

Latin-Extended Character Set & Supported Languages:

- ..........
- ..........
- ..........

Ich konnte diese Informationen nicht in der Dokumentation zu Google Web Fonts oder von Googling finden.

da ich bin
quelle
7
Beim Vergleich von Alphabeten kann ich jetzt sagen, dass die "lateinische" Teilmenge einer Schriftart mindestens Englisch, Spanisch, Deutsch und Französisch vollständig unterstützt.
its_me

Antworten:

92

Latein

aka Unicode Latin1-Supplement (U + 0080 bis U + 00FF) soll hauptsächlich westeuropäische Sprachen unterstützen (wie Sie bereits erwähnt haben: Französisch, Deutsch, Spanisch, auch Portugiesisch, Italienisch, Irisch, Isländisch, Sprachen skandinavischer Länder und ungewollt auch andere Sprachen in der Liste unten erwähnt). Englisch wird von Standard-ASCII unterstützt. ASCII (die ersten 127 Zeichen, 95 davon sind Grapheme U + 0020 bis U + 007E) wurde als allererster Block in Unicode mit dem Namen Basic Latin platziert. Dieser Block wird als Teil von "Latin" betrachtet und normalerweise auch in nicht-lateinischen Schriftarten unterstützt, um den Schriftnamen auf lateinischen Systemen korrekt anzuzeigen.

Lateinisch erweitert

Latin Extended in Google-Schriftarten bedeutet, Latin-Extended-A (U + 0100 bis U + 017F) praktisch zu blockieren, das (kombiniert mit "Latin") alle gängigen lateinisch geschriebenen Texte unterstützen soll. Die meisten Sprachen, die diesen Block verwenden, verwenden auch Zeichen aus "Latein". Daher enthalten "Latin-Extended" -Schriftarten normalerweise eine Obermenge von "Latein" -Zeichen, dies ist jedoch nicht garantiert.

In Unicode gibt es auch einen lateinisch-erweiterten B-Block, der in nationalen Alphabeten für die Zeichen Ə, Ș, Ț (diese werden jedoch häufig durch Ä, Ş, Ţ aus Extended-A ersetzt) ​​und vietnamesisch Ơ, Ư (aber dies) benötigt wird hat eine eigene Kategorie für Google-Schriftarten).

Afrikanische lateinische Sprachen werden von den Blöcken Unicode Latin-Extended-B und Latin-Extended-Additional unterstützt, diese werden jedoch meist nicht von der Kategorie Latin Extended von Google unterstützt. Es gibt noch exotischere C-, D- und E-Erweiterungen (insgesamt 252 Zeichen), aber ich habe sie im wirklichen Leben nicht gesehen, daher zählt Google sie vermutlich auch nicht in der Kategorie Latin Extended.

Nach meiner Beobachtung ordnet Google Schriftarten in die Kategorie Latin Extended ein, wenn sie einige, aber nicht unbedingt alle Zeichen aus dem Latin-Extended-A-Block enthalten . Webfonts müssen klein sein, um das Laden von Seiten nicht zu verlangsamen (das Format woff / woff2 wird bevorzugt). Je mehr Zeichen die Schriftart enthält, desto größer ist ihre Größe (Schriftarten, die das gesamte BMP abdecken, können über 10 MB wachsen). Der Autor beschreibt häufig den Zweck seiner Schriftart, sodass nur er die Logik hinter der Zeichenunterstützung beschreiben kann. Beispielsweise unterstützt die Schriftart Lato Google nur polnische Zeichen aus dem Block Latin Extended A (der Autor ist ein Pole), befindet sich jedoch in der Kategorie "Latin Extended" von Google. Versuchen Sie, Zeichen aus der folgenden Liste anzuzeigen, um herauszufinden, ob die Schriftart eine bestimmte Sprache unterstützt.

Sprachunterstützung

Aus der Liste der lateinisch geschriebenen Alphabete, die unten auf Omniglot und anderen Quellen geprüft wurden , zähle ich nicht:

  • Digraphen aus Latin Extended, die üblicherweise durch separate Zeichen ersetzt werden (Æ wird von Latin1-Supplement unterstützt, ß war früher Digraph)
  • Nicht-lateinische Alphabete, da es sich um Latin vs. Latin-Extended handelt. Einige Sprachen verwenden zwei Schriftsysteme: Ich schließe diese nicht ein, wenn Latein selten ist (wie Abchasisch), bis ein offizieller Schritt gemacht wird (wie Kasachstan).
  • Minderheitensprachen und tote Sprachen (Adyghe, Archi, alte baltische Sprachen, Bislama, Chamorro, Tschuwaschisch, Zypriotisch, Dalecarlianisch, Extremaduranisch, Fala, Elfdalisch, Färöisch, Gilbertesisch, Glosa, Haida und Eskimo-Aleutisch, Ikizu, Iñupiaq, Latgalisch, Istriotisch, Livländisch, Ladinisch, Kaschubisch, Marshallisch, Mirandisch, Montenegrinisch, Altnordisch, Nuxalkisch, Okzitanisch, Rätoromanisch, Rotokas, Sami-Sprachen, Samoanisch, Ober- und Unter-Sorbisch, Tahitianisch, Tawlu, Tetum, Tonganisch, Ulithianisch, Yapeseisch, Zuni, indianisches Latein Alphabete)
  • historische Zeichen, die in den neuesten Versionen von Alphabeten nicht verwendet wurden (wie doppelte Grabakzente, ſ, ĸ)
  • Transliterationszeichen, die fast ausschließlich Linguisten vorbehalten sind, nämlich Pinyin, IPA, UPA

Bitte kommentieren Sie, wenn etwas Wichtiges fehlt oder wenn in der elektronischen Kommunikation eine Minderheitensprache verwendet wird.

ASCII (Basic Latin, wird oft auch in nicht-lateinischen Schriftarten unterstützt)

Klassisches Latein, Afrikaans, Asturisch, Corsu, Niederländisch, Grönländisch, Gälisch, Haitianisch (Kreolisch), Malaiisch, Shona, Sizilianisch, Suaheli.

Englisch wird ebenfalls unterstützt, mit handlichen '¢' (amerikanisch) und '£' (britisch) aus dem Latin1 Supplement, obwohl andere Währungssymbole (wie '€') viel später hinzugefügt wurden: seit Unicode 2.0 im Jahr 1998, im Blockstart 0x20A0).

Latein

  • Albanisch Ç, Ë (Ç ist nicht im Arbëresh-Dialekt)
  • Katalanisch À, É, È, Í, Ï, Ŀ, Ó, Ò, Ú, Ü, Ç (Ŀ aus Ext-A kann als L mit Zwischenzeichen geschrieben werden)
  • Dänisch , Norwegisch Æ, Å, Ø
  • Finnisch Å, Ä, Ö, Š, Ž (Š, Ž aus Ext-A selten verwendet, kann S, Z verwenden)
  • Philippinisch Á, À, Â, É, È, Ê, Ë, Í, Ì, Î, Ñ, Ó, Ò, Ô, Ú, Ù, Û
  • Französisch Æ, Œ, Â, À, É, È, Ê, Ë, Ç, Î, Ï, Ô, Ù, Û, Ü, Ÿ, »,« (Œ aus Ext-A weniger verbreitet und auf Wegweisern verwendet, aber Leute verwenden oe normalerweise stattdessen in Nachrichten, selten Ÿ von Ext-A nur in französischen Namen, der Rest einschließlich ÿ in der lateinischen 1-Beilage, Geschichte dahinter [fr] , Anmerkung auf Wikipedia [en] )
  • Deutsch Ä, Ö, Ü, ß
  • Isländisch Æ, Á, É, Í, Ó, Ö, Ú, Ý, Þ, Ð
  • Irisch Á, É, Í, Ó, Ú
  • Italienisch Ì, Ù, ª, º (die letzten beiden manchmal unterstrichen, auf Englisch auch in Numero beliebt - Nº)
  • Khasi Ñ, Ï
  • Piemontesisch Ë, Ò
  • Portugiesisch Á, Â, Ã, À, Ç, É, Ê, Ó, Ô, Õ, Ú, ª, º
  • Sardinisch Ç
  • Spanisch und Galizisch Ñ, ¿, ¡, ª, º
  • Schwedisch Å, Ä, Ö

Lateinisch erweitert

  • Azeri Ç, Ğ, I (punktloser Kleinbuchstabe), İ, Ö, Ş, Ü, Ə (Ə aus Ext-B kann durch Ä ersetzt werden, dann dasselbe Alphabet wie Türkisch)
  • Krimtatar Ç, Ǧ, I (punktloser Kleinbuchstabe), İ, Ñ, Ö, Ş, Ü (Ǧ aus Ext-B kann durch Ğ aus Ext-A ersetzt werden)
  • Serbisch , Bosnisch und Kroatisch Ć, Č, Đ, Š, Ž
  • Tschechisch Á, Č, Ď, Ě, É, Í, Ň, Ó, Ř, Š, Ť, Ú, Ů, Ý, Ž
  • Estnisch Ä, Ö, Õ, Ü, Š, Ž
  • Esperanto Ĉ, Ĝ, Ĥ, Ĵ, Ŝ, Ŭ
  • Friaulisch , Ê, Î, Ô, Û
  • Gagaus (Moldawien) Ä, Ç, Ê, I (punktloser Kleinbuchstabe), İ, Ö, Ş, Ţ, Ü
  • Guaraní (Paraguay) Á, Í, Ó, Ã, Ẽ, G̃, Ĩ, Ñ, Õ, Ũ, Ỹ (Ĩ, Ũ von Ext-A, Ẽ, Ỹ von Ext-Additional, G̃ nicht in Unicode, nur mit Kombination diakritische Zeichen) Zeichen außerhalb des Ext-A-Bereichs werden häufig mit Zirkumflex (Ê, Ĝ, Î, Û, Ŷ) transkribiert.
  • Hawaiianer Ā, Ē, Ī
  • Ungarisch Á, É, Í, Ó, Ö, Ő, Ú, Ü, Ű
  • Kasachisch (2017-2025 geplant, von kyrilisch zu wechseln) Ä, Ç, Ğ, I (punktloser Kleinbuchstabe), İ, Ŋ, Ö, Ş, Ü (mehrfach überarbeitet, Version 2019 )
  • Kurdisch Ç, Ê, Î, Ş, Û
  • Lettisch Ā, Č, Ē, Ģ, Ķ, Ī, Ļ, Ņ, Ō, Ū, Ŗ, Š, Ž
  • Litauisch Ą, Č, Ę, Ė, Į, Š, Ų, Ū, Ž
  • Maltesisch Ċ, Ġ, Ħ
  • Maori Ā, Ē, Ī, Ō, Ū (Minderheit, aber seit 2015 bekannter und beliebter)
  • Polnisch Ą, Ć, Ę, Ł, Ń, Ó, Ś, Ź, Ż
  • Romani Č, Š, Ž (gesprochene, aber selten geschriebene Sprache)
  • Rumänisch Ă, Â, Î, Ș, Ț (Ș, Ț aus dem lateinischen Ext-B, kann Ş, Ţ aus Ext-A verwenden)
  • Sami (Nord-, Minderheitensprache, hat aber ein exklusives Ŧ in Ext-A) Á, Č, Đ, Ŋ, Š, Ŧ, Ž
  • Slowakisch Ä, Á, Č, Ď, É, Í, Ĺ, Ľ, Ň, Ó, Ô, Ú, Š, Ŕ, Ť, Ý, Ž
  • Slowenisch Č, Š, Ž
  • Tatar (seit 2012) Ä, Ç, Ğ, İ, I (punktloser Kleinbuchstabe), Ñ, Ö, Ş, Ü
  • Türkisch Ç, Ğ, I (punktloser Kleinbuchstabe), İ, Ö, Ş, Ü
  • Vietnamesisch Ă, Â, Đ, Ê, Ô, Ơ, Ư (Ơ, Ư in Ext-B plus Kombinieren der Töne 0x300 und 0x301, siehe Kombinieren diakritischer Zeichen unten, hat eine spezielle Kategorie für Google-Schriftarten)
  • Walisisch , Ê, Î, Ô, Û, Ŵ, Ŷ

Latin Extended, African (wird in Latin-Extended-Schriftarten meist nicht unterstützt) . Volle Unterstützung des afrikanischen Alphabets haben Ubuntu, Fira Sans, EB Garamond, Tinos, Nachrichtenzyklus, Didact Gothic, M Plus, Sawarabi, Cousine, Caudex, Judson, Andika (und natürlich Noto, siehe unten).

  • Bari (Kongo) Ŋ, Ö
  • Bambara (Mali) Ɛ, Ɲ, Ɔ (alle aus Ext-B)
  • Berber (Tuareg) (Sahara) Ă, Ḍ, Ɣ, Ǝ, Š, Ž, Ḥ, Ḷ, Ṣ, Ṭ, Ẓ (Ɣ, Ǝ aus Ext-B, Zeichen mit Punkt unten aus Ext-Additional)
  • Chichewa (Chewa) (Ostafrika) Ŵ
  • Dagbani (Kongo) Ɛ, Ɣ, Ɔ, Ŋ, Ʒ (Ɛ, Ɣ, Ɔ aus Ext-B)
  • Dinka (Sudan) Ä, Ë, Ɛ, Ɛ̈, Ɣ, Ï, Ŋ, Ö, Ɔ, Ɔ̈ (Ɛ, Ɣ, Ɔ aus Ext-B, Ɛ̈, Ɔ̈ nicht in Unicode, nur mit kombinierter diakritischer Markierung)
  • Fula (Westafrika) Ɓ, Ɗ, Ƴ, Ŋ (Ŋ aus Ext-A, Rest aus Ext-B)
  • Hausa (Tschad) Ɓ, Ɗ, Ƴ, Ƙ, R̃ (R̃ nicht in Unicode, nur mit kombinierter diakritischer Markierung, Rest von Ext-B)
  • Igbo (Nigeria) Ṅ, Ị (Ext-Additional)
  • Madagassisch (Madagaskar) N̈ (nicht in Unicode, nur mit kombinierter diakritischer Marke, kann durch Ñ aus dem Lateinischen ersetzt werden)
  • Pan-Nigerian Ɓ, Ɗ, Ǝ, Ẹ, Ị, Ƙ, Ṣ, Ụ (Ɓ, Ɗ, Ǝ, Ƙ von Ext-B, Ẹ, Ị, Ṣ, Ụ von Ext-Additional)
  • Wolof (Senegal) À, É, Ë, Ñ, Ŋ, Ó
  • Yoruba (Westafrika) Ẹ, Ọ, Ṣ (Ext-Additional + Kombinationstöne Á, À, Ā)

Diakritische Zeichen kombinieren

Alternativ kann die Schriftart den Block Kombinieren diakritischer Zeichen unterstützen: U + 0300 bis U + 036F. Zum Beispiel Řkann entweder als eingegeben werden U+0158(auch bekannt als vorverfasstes Zeichen ) oder als R+ U+030C. Programme, die Unicode unterstützen, sollten sowohl als eigenständiges Zeichen angezeigt als auch behandelt werden. Wenn das Programm oder die Schriftart jedoch kein Repertoire unterstützt , wird die kombinierte diakritische Markierung möglicherweise etwas verlegt (wie zu niedrig Ɛ̈ hier auf meinem System) Sehr detaillierte Fragen und Antworten zu Unicode zu diesem Thema.

Nützliche Schriftarten mit mehrsprachiger Unterstützung

Möglicherweise möchten Sie einige Schriftarten (sofern die Lizenz dies zulässt) über den Font Squirrel- Dienst anpassen oder als Backup verwenden. Zunächst gibt es breite unterstützende kostenlose Schriftarten:

  • Ich mag wirklich gut aussehende Serif Quivira Open-Type-Schrift mit 11 + k Zeichen, 1,5 MB
  • Auf vielen Computern ist Arial Unicode installiert (Teil von MS Office, über 50.000 Zeichen, 22 MB).
  • Es gibt ein Noto-Projekt von Google, das ALLE, aber die neuesten Unicode-Zeichen in Serifen-, Sans-Serif- und UI-Schriftarten enthält, die nach Blockunterstützung sortiert sind (1,1 GB).
  • als letztes Backup - Schriftart, können Sie hässlich suchen betrachten Unifont (50 + k Zeichen, aber nur 11 MB und Embedded - Geräte freundlich)
Jan Turoň
quelle
14
Wissen Sie, ob der Zeichensatz "Latin-Extended" in Google Web Fonts sowohl Latin1-Extended-A- als auch Latin1-Extended-B-Zeichen enthält oder nur eines davon?
its_me
5
In Google Web-Schriftarten bedeutet "Latin-Extended", dass die Schrift einige oder alle Glyphen aus Latin1-Extended-A und Latin1-Extended-B enthält.
MatTheCat
@MatTheCat (oder jemand anderes, der dies liest) Jede Möglichkeit, einen Link bereitzustellen, um auf die Behauptungen in Ihrer Erklärung zu Google Web Fonts Latin-Extended zu verweisen, definiert als "einige oder alle Glyphen von Latin1-Extended-A und / oder Latin1-Extended-" B "?
In Bezug auf Polen fehlt in dieser Antwort ein zusätzliches polnisches Zeichen: "Ą" (das hätte ein Kommentar sein sollen)
Petter Friberg,
1
Š, Ž werden in der finnischen Sprache sehr selten verwendet, nur mit seltsamen importierten Wörtern wie "šekki" (was bedeutet, dass stattdessen normale s verwendet werden können). Ich würde sagen, dass sie nicht notwendig sind.
ollpu