Base64-codierte Bilder und Verfügbarkeit ihrer Metadaten für Googlebot
9
Wenn ich ein Bild als img- srcmit base64-Daten-URI in eine Seite einbette , sind die Metadaten des Bildes (EXIF, IPTC, XMP) für den Imagebot von Google noch verfügbar?
Wahrscheinlich nicht. Googlebot benötigt wahrscheinlich eine URL, auf die Nutzer eingestuft und verwiesen werden können.
John Conde
1
Vergessen Sie die EXIF-Daten. Ich bin mir nicht einmal sicher, ob Google-Bilder ein Bild indizieren würden, das keine eigene URL hat.
Stephen Ostermiller
@ StephenOstermiller: das ist die Frage: Wenn es solche Bilder indiziert, liest es auch EXIF
Evgeniy
@Evgeniy Wie Stephen weist darauf hin, Daten URIs sind nicht getrennt von ihrem enthält Dokument (siehe diese für weitere Informationen ). Suchmaschinen indizieren URLs, sodass nur das enthaltene Dokument indiziert wird, und ob sie die in einem Daten-URI enthaltenen Metadaten indizieren würden (wenn es tatsächlich auch diese enthält, wodurch es noch größer wird), ist ein stummer Punkt. Zur Bestätigung können Sie eine Quellcode-Suchmaschine verwenden, um nach einem Daten-URI zu suchen und dann festzustellen, ob dieses Bild indiziert wurde und EXIF-Informationen in Google enthält. Das scheint jedoch höchst unwahrscheinlich.
dan
@Evgeniy Beachten Sie, dass das Cross-Posting derselben Frage an mehr als eine Stack Exchange-Site nicht geduldet wird.
dan
Antworten:
6
Google indiziert keine Daten-URI-Bilder für die Google-Bildsuche. John Mueller von Google sagt dies hier und in den Kommentaren unten. Da Daten-URI-Bilder in der Google-Bildsuche nicht indiziert werden, sind die darin enthaltenen EXIF-Daten irrelevant.
Sie können überprüfen, ob diese Bilder nicht indiziert sind. Ich suchte in Google-Bildern nach "data uri" und überprüfte die Ergebnisse vor Ort. Alle Bilder, die ich angesehen habe, waren Bilddateien, keine Base64-codierte Bild-URI. Wenn Google Daten-URI-Bilder indizieren könnte, würden einige davon in den Suchergebnissen für diesen Begriff angezeigt.
Wenn Google jemals beschließt, Daten-URI-Bilder zu indizieren, sollte es in der Lage sein, die EXIF-Daten von ihnen abzurufen. Data uri ist die gesamte Datei base64, die mit einem data:image/png;base64,Präfix codiert ist (keine Leerzeichen oder neuen Zeilen) . Alle Metadaten in der Datei wären weiterhin in der Base64-codierten Daten-URI-Version vorhanden.
Ich verwende Daten-URI-Bilder auf einer meiner Websites. Ich mache das, weil Benutzer normalerweise nur eine Seite der Site anzeigen, um alle Informationen zu erhalten, die sie benötigen. Das Inline-Einfügen aller CSS-, JS- und Bilddaten in die Seite verbessert die Leistung erheblich. Die Bilder sind alle klein, daher funktioniert die Technik besonders gut.
Meine Website erhält eine angemessene Menge an Datenverkehr von Internet Explorer 7 und früheren Versionen, die keine Daten-URI-Bilder unterstützen. Deshalb muss ich ihnen bedingt dienen. Ich habe die Bilder auch auf dem Server und wähle reguläre Bild-URLs oder den Daten-URI basierend auf dem User-AgentHeader. Ich behandle Bots (einschließlich Googlebot) genauso wie IE 7, dh ich diene den Bildern als HTTP-URLs. Ich mache das, weil das Einfügen von Daten-Uri-Bildern die Seitengröße dramatisch erhöht. Die meisten Bots müssen die Bilder nicht herunterladen, daher ist es für sie effizienter. Ich hatte auch festgestellt, dass die Google Webmaster-Tools berichteten, dass Googlebot meine Website mit dafür aktivierten Daten-URI-Bildern viel langsamer crawlt. Dies könnte technisch als Tarnung betrachtet werden, aber es wäre eine Möglichkeit, Ihre Daten-URI-Bilder zu indizieren.
@StephenOstermiller-codierte Zeichenfolge kann Leerzeichen enthalten: goo.gl/RF8r07 . Ich werde ein Bild mit EXIF füllen, es codieren, veröffentlichen und schauen, ob es in den Index kommt.
Evgeniy
3
John Mueller (von Google) gibt hier an, dass Google Bilder aus Daten-URIs im Allgemeinen nicht indiziert. Viele Online-Tools, die zum Codieren dieser Informationen verwendet werden, entfernen auch Metadaten. Es hängt also wirklich davon ab, wie sie codiert werden, ob die EXIF-Informationen beibehalten werden. Da sie jedoch ohnehin nicht indiziert sind, ist dies ein strittiger Punkt. Teilen Sie uns Ihre Ergebnisse mit (lassen Sie die URL zum Bild nicht indizieren - Google verwendet auch die Bilderkennung, damit EXIF-Informationen aus übereinstimmenden Bildern verwendet werden können).
dan
1
@ Dan danke! Ihr Link zu John Müllers Antwort löscht jetzt viele Dinge gleichzeitig! Wenn G keine Bilder indiziert, bei denen kein URI abgerufen werden kann, muss nicht berücksichtigt werden, ob das EXIF darin verbleibt oder nicht.
Evgeniy
3
Wie oben verlinkt, indizieren wir diese derzeit nicht separat als Bilder. Das könnte sich in Zukunft ändern, aber zumindest für den Moment möchten Sie separate Bild-URLs verwenden, wenn diese Bilder in der Bildsuche indiziert werden sollen.
John Mueller
2
Während Google Bilder als Base64-codierte Daten-URIs auf seinem eigenen SERP verwendet, indiziert es solche Bilder nicht auf anderen Websites. Vielen Dank an @dan, der mich auf die Google Groups-Diskussion hingewiesen hat, in der John Mueller dieses Problem erklärt . Dies bedeutet auch, dass die Frage nach dem Vorhandensein von EXIF-Daten in solchen Bildern nicht relevant ist.
Diese Erklärung macht deutlich, auf welche Bilder diese Technik zur Leistungsoptimierung besser angewendet werden kann: kleine Bilder wie Symbole, Favoriten und Schaltflächen sowie Bilder, die keinen zusätzlichen Wert für den Inhalt der Website liefern.
Wenn auf der anderen Site ein Bild mit zusätzlichem Inhaltswert als base64-codierte Daten-URI kategorisch eingebettet werden muss, besteht die einzige bewährte Methode zum Bereitstellen der Metadaten des Bildes darin, das Markup von Schema.org zu verwenden, mit dem EXIF-Daten ausgehandelt werden können, z. B. mit diesem Art von Markup.
Eine andere vielversprechende Art von Markup für die Aushandlung von Daten, die wie EXIF wie "property: value" aussehen, hat derzeit den Status eines Vorschlags. Aber dieser Artikel aus dem Google-Blog zeigt Schnipsel strukturiert, die durch den Auszeichnungs Vorschlag erzeugt werden können , die ich oben verlinkt.
Antworten:
Google indiziert keine Daten-URI-Bilder für die Google-Bildsuche. John Mueller von Google sagt dies hier und in den Kommentaren unten. Da Daten-URI-Bilder in der Google-Bildsuche nicht indiziert werden, sind die darin enthaltenen EXIF-Daten irrelevant.
Sie können überprüfen, ob diese Bilder nicht indiziert sind. Ich suchte in Google-Bildern nach "data uri" und überprüfte die Ergebnisse vor Ort. Alle Bilder, die ich angesehen habe, waren Bilddateien, keine Base64-codierte Bild-URI. Wenn Google Daten-URI-Bilder indizieren könnte, würden einige davon in den Suchergebnissen für diesen Begriff angezeigt.
Wenn Google jemals beschließt, Daten-URI-Bilder zu indizieren, sollte es in der Lage sein, die EXIF-Daten von ihnen abzurufen. Data uri ist die gesamte Datei base64, die mit einem
data:image/png;base64,
Präfix codiert ist (keine Leerzeichen oder neuen Zeilen) . Alle Metadaten in der Datei wären weiterhin in der Base64-codierten Daten-URI-Version vorhanden.Ich verwende Daten-URI-Bilder auf einer meiner Websites. Ich mache das, weil Benutzer normalerweise nur eine Seite der Site anzeigen, um alle Informationen zu erhalten, die sie benötigen. Das Inline-Einfügen aller CSS-, JS- und Bilddaten in die Seite verbessert die Leistung erheblich. Die Bilder sind alle klein, daher funktioniert die Technik besonders gut.
Meine Website erhält eine angemessene Menge an Datenverkehr von Internet Explorer 7 und früheren Versionen, die keine Daten-URI-Bilder unterstützen. Deshalb muss ich ihnen bedingt dienen. Ich habe die Bilder auch auf dem Server und wähle reguläre Bild-URLs oder den Daten-URI basierend auf dem
User-Agent
Header. Ich behandle Bots (einschließlich Googlebot) genauso wie IE 7, dh ich diene den Bildern als HTTP-URLs. Ich mache das, weil das Einfügen von Daten-Uri-Bildern die Seitengröße dramatisch erhöht. Die meisten Bots müssen die Bilder nicht herunterladen, daher ist es für sie effizienter. Ich hatte auch festgestellt, dass die Google Webmaster-Tools berichteten, dass Googlebot meine Website mit dafür aktivierten Daten-URI-Bildern viel langsamer crawlt. Dies könnte technisch als Tarnung betrachtet werden, aber es wäre eine Möglichkeit, Ihre Daten-URI-Bilder zu indizieren.quelle
Während Google Bilder als Base64-codierte Daten-URIs auf seinem eigenen SERP verwendet, indiziert es solche Bilder nicht auf anderen Websites. Vielen Dank an @dan, der mich auf die Google Groups-Diskussion hingewiesen hat, in der John Mueller dieses Problem erklärt . Dies bedeutet auch, dass die Frage nach dem Vorhandensein von EXIF-Daten in solchen Bildern nicht relevant ist.
Diese Erklärung macht deutlich, auf welche Bilder diese Technik zur Leistungsoptimierung besser angewendet werden kann: kleine Bilder wie Symbole, Favoriten und Schaltflächen sowie Bilder, die keinen zusätzlichen Wert für den Inhalt der Website liefern.
Wenn auf der anderen Site ein Bild mit zusätzlichem Inhaltswert als base64-codierte Daten-URI kategorisch eingebettet werden muss, besteht die einzige bewährte Methode zum Bereitstellen der Metadaten des Bildes darin, das Markup von Schema.org zu verwenden, mit dem EXIF-Daten ausgehandelt werden können, z. B. mit diesem Art von Markup.
Eine andere vielversprechende Art von Markup für die Aushandlung von Daten, die wie EXIF wie "property: value" aussehen, hat derzeit den Status eines Vorschlags. Aber dieser Artikel aus dem Google-Blog zeigt Schnipsel strukturiert, die durch den Auszeichnungs Vorschlag erzeugt werden können , die ich oben verlinkt.
quelle