Was ist der Effekt von Ligaturen im Web in Bezug auf SEO

19

Alle Designer lieben Ligaturen, aber Vanille-Web-Typografie ist einfach zum Kotzen. Ich habe von Smartypants gehört , die viele dieser Probleme lösen und sexy Zitate, hinreißende Kaufmännisches und alles bringen. Optisch ist es einfach perfekt.

Aber ich mache mir Sorgen um SEO. Sagen wir auf einer Webseite, das Wort finallywird finally. Können Suchmaschinen dieses Wort indizieren und die Seite bei der Suche zurückgeben finally(ohne Ligatur)?

TKrugg
quelle

Antworten:

3

Zusammenfassung

Wenn Ihr Server Seiten mit Ligaturen ausgibt (wie es Smartypants tun), sind Suchmaschinen inkonsistent. Bing indiziert die Ligaturen derzeit nicht richtig. Ich würde allgemein sagen, es bittet um Ärger. Da sich Suchmaschinen ändern, können Sie anhand der folgenden Methode testen, wie sich Suchmaschinen für Indexligaturen interessieren .

Wenn Ihr Server Gerichte aus Seiten mit normalen Text, dann Javascript sie in Ligatur dreht, ist das in Ordnung . Suchmaschinen wenden keine Änderungen an Javascript-Inhalten an, bevor sie Seiten indizieren (obwohl behauptet wird, dass es einige Ausnahmen gibt, wie das Laden von Facebook-Kommentaren ). Da es eine branchenübliche Methode gibt, mit der Suchmaschinen dynamischen Inhalt erhalten, und diese Methode von Google unterstützt wird , wäre es eine große Überraschung, wenn sich dies in Zukunft ändern würde. Google empfiehlt, Ihre Website mit einem Nur-Text-Browser (z. B. Lynx ) zu durchsuchen, um zu sehen, wie Ihre Inhalte von einer Suchmaschine angezeigt werden .


Weitere Einzelheiten zum ersten Fall (Seiten mit Ligaturen im Code) ...


In der Theorie

... es sollte für eine gut eingestellte Suchmaschine keinen Unterschied machen.

Zunächst hilft es, den Unterschied zwischen Glyphen und Zeichen zu verstehen . Eine Ligatur ist eine Glyphe, die für zwei Zeichen steht f i. Wie Software damit umgeht, hängt von der jeweiligen Software ab und hängt vom Kontext und der jeweiligen Aufgabe ab. Aus den Beispielen in dieser verknüpften Frage geht hervor, dass beim Kopieren und Einfügen von Glyphen die Einfügungen unterschiedlich ausfallen: Manchmal wird die Glyphe eingefügt, manchmal Die Glyphe wird als zugehörige Zeichen und behandelt fund ieingefügt.

Jeder gut gemachter automatischer Textprozessor, der in Textsemantik (Suchmaschinen, Rechtschreibprüfung, Bildschirmleser ...) interessiert ist , sollte eine Glyphe als identisch mit den Zeichen behandelt es steht, und sollte behandeln finallyals identisch finally, denn das ist die textliche Bedeutung der Glyphe.

In der Praxis

Nicht alles ist gut gemacht ...

Hier ist eine einfache Möglichkeit, Suchmaschinen zu testen. Hier ist eine Textzeile aus dieser anderen Frage:

Copy the ligature fi from Illustrator to this input box

Wenn wir die nicht ligierte Version dieses Satzes nehmen und in doppelten Anführungszeichen suchen:

(suche nach "Copy the ligature fi from Illustrator to this input box"):

  1. ... wenn eine Suchmaschine Ligatur-Glyphen als Übereinstimmungen mit den von ihnen dargestellten Zeichen behandelt , wird diese Seite (und, wenn sie indiziert ist, diese) gefunden.
  2. ... Wenn eine Suchmaschine Ligatur-Glyphen als andere Zeichen als die von ihnen dargestellten behandelt, findet sie nichts, bis diese Seite indexiert ist. Dann findet sie nur diese Seite und Suchvorgänge mit der Ligatur-Version finden diese Seite.
  3. ... wenn eine Suchmaschine ausflippt vollständig beim Anblick von Glyphen wie Ligaturen, wird es nichts, nicht einmal diese Seite und sucht mit der Ligatur Version findet auch nichts finden

Einige schnelle Ergebnisse für die Top-5-Suchmaschinen der Welt (Links zu Suchergebnissen):

  • Google: Gut (Typ 1) . (Trotz des Kommentars unten wird es gut mit Unicode- oder HTML-Entity-Formatierungen fertig.)
  • Bing: Fail ( Typ 2 ).
  • Yahoo: Fail ( Typ 2 ) (stellt sich heraus, dass Yahoo "Powered by Bing" ist)
  • Yandex (russisch): Gut (Typ 1)
  • Baidu (chinesisch): ähm, es scheinen überhaupt keine Seiten von graphicdesign.stackexchange.com in Baidu-Suchen zu erscheinen ... vielleicht sind wir dort verboten ...?!
user56reinstatemonica8
quelle
Nee, ich habe gerade meine Antwort bearbeitet, sieh dir den Quellcode auf diesem Link an. Es ist alles Unicode wie & # xfb00; welcher Google-Algorithmus ignoriert.
Ryan
Eigentlich stimmt Google mit denen überein: Sehen Sie sich an, was es hier (Ligaturen) und hier (Klartext) hervorhebt - beide stimmen mit beiden überein. Aber ich stimme Ihrem Rat zu ...
user56reinstatemonica8
... (diese URLs waren riesig, brauchen 2 Kommentare), es scheint, als würde es Ärger geben. Wenn Bing nicht mit Ligaturen übereinstimmt, werden andere wichtige Dienste dies auch nicht tun.
user56reinstatemonica8
Schauen Sie sich die URL des ersten Links und den Quellcode an, mit dem er übereinstimmt: Sie werden feststellen, dass Google (derzeit ...) keine Probleme mit der Unicode-Formatierung hat und Unicode-Ligaturen, HTML-Entity-Ligaturen und reguläre separate Zeichenpaare indiziert gerne f ials gleichwertig ohne probleme. Google scheint gut zurechtzukommen - aber die Inkonsistenz zwischen verschiedenen Suchmaschinen ist (zumindest in meinem Buch) ein Dealbreaker.
user56reinstatemonica8
3

Basierend auf dem einen Live-Beispiel, das ich gesehen habe, wäre ich äußerst besorgt, weil es die SEO beeinflussen wird. Die Sonderzeichen werden als Unicode analysiert, sodass sie vom Google-Algorithmus nicht gelesen werden. Es sollte für sparsame Zwecke in Ordnung sein, aber ich würde nicht verrückt damit werden oder es für etwas Wichtiges wie einen Titel verwenden.

Hier ist der Link zu dem Live-Beispiel, das ich mir angesehen habe: http://pages.cs.wisc.edu/~wolfson/ligatures.html

Ryan
quelle
Ich denke nicht, dass es diese Buchstaben im Quellcode sein werden. Sieht so aus, als wäre Smartypants eine serverseitige Sache, die Eingaben analysiert und die Glyphen in den in der Datenbank gespeicherten Text und damit auch in den Quellcode speichert. Das heißt, ich denke, es wird für SEO sowieso in Ordnung sein.
user56reinstatemonica8
Eigentlich habe ich element inspiziert, aber die Quelle nicht angezeigt. Ich werde meine Antwort bearbeiten.
Ryan
1
Ich bin mit "extrem besorgt" definitiv einverstanden, Unicode-Unterstützung ist notorisch inkonsistent. Aber für den Datensatz kann Google (derzeit ...) Unicode indizieren und ordnet (derzeit ...) diesen Unicode-Ligaturen auf dieser Seite Suchen nach l i f iusw. zu (siehe Fettdruck in der Vorschau). Aber ich würde mich definitiv nie darauf verlassen wollen ...
user56reinstatemonica8
Was ist, wenn Ligaturen über Javascript platziert wurden? Es würde nicht das HTML-Dokument ändern, daher für Suchmaschinen völlig unsichtbar sein? Wäre das eine Lösung?
TKrugg
Ja, das sollte in Ordnung sein - Suchmaschinen indizieren normalerweise das Originaldokument ohne Javascript. Wahrscheinlich möchten Sie überprüfen, ob dadurch die Ladezeit der Seite nicht wesentlich verlangsamt wird und der Betrachter keinen Ruck erhält, wenn die Vanillezeichen beim Laden der Seite durch die Ligaturen ersetzt werden.
user56reinstatemonica8