Warum ändert Google Text & Tabellen den Titel meines Dokuments in chinesische Schriftzeichen?

8

Wenn ich eine PDF-Datei aus einer E-Mail öffne (passiert bei einigen, aber nicht bei allen PDFs), zeigt Google Text & Tabellen den richtigen Titel an, während die Vorschau für mein Dokument angezeigt wird. Eine Sekunde später wird der Titel in Chinesisch geändert.

Dies geschieht sowohl in Firefox als auch in Chrome.

Vor: Alt-Text

Nach: Alt-Text

Hier ist ein weiteres Beispiel für englischen Text:

JS 6.10.pdf - Unterstützt von Google Text & Tabellen

Hier ist das eigentliche Chinesisch, aus dem es wird:

㽉 㽮 㽴 㽵 㽩 㽴 㽟 㽑 㽂 㽏 㽂 㽟 㽉 㽮 㽴 㽥 㽲 㽮 㽡 㽬 㽬 㼮 㽰 㽤

Michael Pryor
quelle
Möglicherweise ein Codierungsproblem? Sehen Sie das in allen Browsern?
Ale
Ich sehe das auch seit dem heutigen Morgen. Seltsam.
Neo
Ist es möglich, dass Google derzeit ein Geokodierungsproblem hat? Es scheint, als würde Google Ihren Computer so behandeln, als wäre er in einem anderen Land.
Ben Hoffman
@randomben Adobe denkt manchmal, ich bin Deutscher aus irgendeinem Grund. Hrm.
Michael Pryor
Sie hatten Probleme mit chinesischen Hackern und Google Apps vor ...
Evan Carroll

Antworten:

1

Ich sehe etwas Ähnliches. Es scheint, dass es zwei Abschnitte der Datei gibt, die nicht korrekt als UTF-8 codiert sind:

00003c0: 3c2f 7363 7269 7074 3e0a 0a0a 3c74 6974  </script>...<tit
00003d0: 6c65 3ee3 bd90 e3bd 8fe3 bd89 e3bd 8ee3  le>.............
00003e0: bd94 e3bc a0e3 bd84 e3bd afe3 bda3 e3bd  ................
00003f0: b5e3 bdad e3bd a5e3 bdae e3bd b420 2d20  ............. -
0000400: 506f 7765 7265 6420 6279 2047 6f6f 676c  Powered by Googl
0000410: 6520 446f 6373 3c2f 7469 746c 653e 0a3c  e Docs</title>.<


0003560: 2d6c 6566 7422 3e3c 6469 7620 636c 6173  -left"><div clas
0003570: 733d 2274 6974 6c65 2067 6f6f 672d 696e  s="title goog-in
0003580: 6c69 6e65 2d62 6c6f 636b 223e e3bd 90e3  line-block">....
0003590: bd8f e3bd 89e3 bd8e e3bd 94e3 bca0 e3bd  ................
00035a0: 84e3 bdaf e3bd a3e3 bdb5 e3bd ade3 bda5  ................
00035b0: e3bd aee3 bdb4 3c2f 6469 763e 0a3c 6469  ......</div>.<di

Ich habe noch nicht herausgefunden, welche Codierung es sein soll.

Ben Gartner
quelle