Deaktivieren Sie die automatische Ligaturbehandlung in PDF / Preview auf El Capitan

4

Möglicherweise habe ich einen schwerwiegenden Fehler in EC gefunden ...

Als Student muss ich häufig kurze Passagen aus PDF-Dokumenten kopieren und in andere Dokumente einfügen (z. B. zum Zitieren). Bisher habe ich bei Yosemite dazu einfach Preview verwendet. Die Vorschau ist fantastisch, da die AI-Algorithmen fast immer korrekt bestimmen, wo Absatzumbrüche sind. So gut wie jeder andere PDF-Viewer, den ich verwendet habe, liefert bei jedem visuellen Zeilenumbruch im PDF-Dokument einen harten Ertrag.

In EC gibt es jedoch einige häufig vorkommende "Ligatur" -Zeichen (dh zwei oder mehr Zeichen, die zusammen gerendert wurden, wie "Th", "ffi", "ff", "fi", "ft" - das sind die, die ich gefunden habe am Ende als Leerzeichen kopieren. Mit anderen Worten, wenn ich ein PDF mit folgendem Text habe:

"This is different from those who can afford to pay for college first; such students may find it less difficult by at least fifty percent."

Ich erhalte diese Ausgabe, wenn ich diesen Text kopiere und einfüge:

" is is di erent from those who can a ord to pay for college  rst; such students may  nd it less di cult by at least   y percent."

Dies ist eindeutig nicht die gewünschte Ausgabe!

Wenn ich den Text langsam zeichenweise anwähle, sehe ich deutlich, dass sich die Auswahl gleichzeitig über alle Buchstaben in der Ligatur bewegt - mit anderen Worten, die Ligatur wird so behandelt, als wäre es ein Zeichen.

Ich habe das PDF auf einem Laborgerät in der Schule getestet, auf dem Yosemite noch ausgeführt wird, und es hat dieses Verhalten nicht gezeigt. Es handelt sich also definitiv um einen in EC eingeführten Fehler.

Gibt es eine Einstellung vielleicht über defaults dass ich dieses Verhalten vollständig deaktivieren kann?

(Als Randnotiz fand ich diesen Fehler heraus, nachdem ich eine Zeitung eingereicht und einen Professor gefragt hatte, warum meine Zitate so lustig aussahen ... Ich habe nicht so sorgfältig Korrektur gelesen, wie ich es hätte tun sollen, aber trotzdem.)

fdmillion
quelle

Antworten:

1

Sind Sie sicher, dass es sich nicht um einen einfachen Schriftersetzungsfehler handelt? In welcher Schriftart wird das PDF gerendert? Haben Sie diese Schriftart installiert? Hat das Laborgerät es installiert? Verwendet das Dokument, in das Sie einfügen, dieselbe Schriftart wie das Quell-PDF?

Ich habe einen einfachen Test mit Ihrem Beispieltext durchgeführt, der in einem Word-Dokument (mit aktivierten Ligaturen) platziert und dann entweder mit der integrierten PDF-Datei von Apple oder Acrobat Pro als PDF gespeichert wurde.

Der Originaltext, ausgeschnitten und eingefügt aus Word:
„Dies unterscheidet sich von denen, die es sich leisten können, zuerst für das College zu bezahlen. Solche Studenten werden es vielleicht um mindestens die Hälfte weniger schwierig finden. “

Apple PDF, aus der Vorschau geschnitten und eingefügt:
„Dies unterscheidet sich von denen, die es sich leisten können, zuerst für das College zu bezahlen. Solche Studenten werden es vielleicht weniger schwierig finden, um mindestens fünf Prozent. “

Adobe PDF, aus der Vorschau ausgeschnitten und eingefügt:
„Dies unterscheidet sich von denen, die es sich leisten können, zuerst für das College zu bezahlen. solche Studenten werden es vielleicht um mindestens fünfzig Prozent weniger schwierig finden. “

Adobe PDF, aus Acrobat Pro ausgeschnitten und eingefügt:
„Dies unterscheidet sich von denen, die es sich leisten können, zuerst für das College zu bezahlen. solche Studenten können es weniger finden
um mindestens fünf Prozent schwierig. “

Alle oben genannten Versuche wurden korrekt eingefügt, mit Ausnahme der "fty" -Ligatur, die sich im Rendering aufgrund der verwendeten PDF-Erstellungs- und Rendering-Methode (n) unterschied. Dieses Zeichen wurde wahrscheinlich nicht korrekt in einfachen Text übersetzt, da ich in Word mehr als nur einfache Ligaturen aktiviert habe (optional und nach Belieben, aber nicht historisch).

Alles in allem scheint es mir nichts anderes zu sein als ein Kodierungs- oder Ersetzungsfehler. Denken Sie daran, dass in ein PDF-Dokument alle erforderlichen Schriftzeichen in die Datei selbst eingebettet sind. Beim Einfügen stimmt die Zielschriftart jedoch nicht unbedingt mit der Quelle überein, insbesondere wenn Sie ein System mit einer Neuinstallation verwenden (dh weniger Schriftarten).

dr.nixon
quelle