Exportieren: Text aus PDF ohne Zeilenumbrüche kopieren

12

Es gibt einige PDF-Dateien in freier Wildbahn, in denen jede Textzeile hartcodiert zu sein scheint. Wenn ich also einen Textblock kopiere, wird alles mitgeliefert: Zeilenumbrüche und sogar "-" Trennzeichen.

Meine Fragen lauten: Wie erstelle ich PDFs in InDesign, bei denen dieses Verhalten nicht auftritt?

Weiß jemand mehr darüber?

KSPR
quelle
2
Ich möchte nur darauf hinweisen, dass dies in vielen wissenschaftlichen Artikeln ein massives Problem ist und ich keinen Grund / keine Lösung für dieses Problem gefunden habe. Ich hoffe auf gute Antworten!
Benteh
... so könnte es eine alte Exportfunktionalität in irgendeiner idiotischen Praxis aus der Präkambrium-Ära sein, die schuld ist.
Benteh

Antworten:

3

Das liegt daran, dass PDFs auf viele Arten aus einer Reihe von Software- und Online-Apps generiert werden können. Bei jeder dieser Methoden werden Textzeilen unterschiedlich behandelt, sodass Sie erst dann erkennen können, wie Text tatsächlich eingeschlossen ist, wenn Sie versuchen, ihn von PDF zurück nach InDesign zu kopieren und einzufügen.

InDesign-exportierte PDFs behalten jedoch im Allgemeinen die Leerzeichen am Ende jeder Zeile bei, sodass Sie sich keine Sorgen machen müssen, dass nach jeder Zeile ein Absatz zurückgegeben wird. Um 100% ige Sicherheit zu gewährleisten, aktivieren Sie das Create Tagged PDFKontrollkästchen, wenn Sie eine PDF-Datei aus InDesign exportieren. Ich persönlich werde dieses Kontrollkästchen immer aktivieren und es in alle von mir verwendeten Voreinstellungen aufnehmen. Weitere Details zu dieser Option finden Sie hier .

Wenn Sie eine schlecht exportierte PDF-Datei aufrufen und nach jeder Textzeile die nachfolgenden Absatzretouren bereinigen müssen, ist Suchen / Ersetzen die schnellste Option. Geben Sie ^pdas Find whatFeld ein und fügen Sie ein Leerzeichen in das Change toFeld ein. Wählen Sie entweder Storyoder Selectionunten , je nach Situation , und dies sollte Ihren Text aufzuräumen.

Dialogfeld "Änderung suchen"

Lucian
quelle
2

Eine Möglichkeit besteht darin, die PDF-Datei als HTML- Datei aus Acrobat Pro zu exportieren , diese Datei in Ihrem Webbrowser zu öffnen und den Text von dort zu kopieren.

Anders als beim Exportieren als Textformat werden beim HTML-Code normalerweise keine Zeilen umbrochen.

Meines Wissens können Sie dies nicht von InDesign verhindern. Es scheint sich um ein Verhalten zu handeln, das von der PDF- oder PDF-Software stammt. Es ist möglich, dass jede Veröffentlichungssoftware, die "Textrahmen / -felder" verwendet, diese Art von Texten in einem PDF erstellt.

Go-Junta
quelle
-2

Das liegt daran, dass pdfs auf diese Weise Text erkennt - jede Zeile wird tatsächlich zu einem Absatz (daher wird am Ende davon zurückgegeben). Es gibt keinen Weg daran vorbei, Sie müssen es global in Dokumenten ändern, nachdem Sie es kopiert haben, indem Sie die Option Suchen / Ersetzen und versteckte Zeichen verwenden.

Agnieszka Szuba
quelle
1
Aber es gibt PDFs, die dieses Verhalten nicht haben. PDFs, in denen Sie das Ganze mühelos kopieren können. Ich frage mich nur, wie dies beim Export erreicht werden kann.
KSPR