Wie konvertiert man eine pdf-Datei in eine odt-Datei?

32

Ich möchte eine .pdfDatei in eine .odtDatei konvertieren, damit ich sie weiter in eine .docDatei konvertieren kann . Gibt es eine Software / ein Skript, die / das dies kann? Ich habe versucht, den Inhalt der .pdfDatei zu kopieren und in Liberoffice Writer einzufügen. Die Formatierung wird nicht beibehalten.

Das Dokument ist vertraulich, daher würde ich es vorziehen, keinen Onlinedienst für die Konvertierung zu verwenden.

Jede Hilfe wird sehr geschätzt.

Ankit
quelle
Verwandte (aber kein Duplikat!): Wie konvertiere ich ein Odt nach PDF?
Eliah Kagan
1
Für LIBREOFFICE / OpenOffice spezifische Fragen empfehle ich ask.libreoffice.org
Bucic

Antworten:

15

Ich ärgerte mich auch über das Fehlen eines kostenlosen PDF zu ODT Konverters. Ich brauchte nicht einmal etwas Kompliziertes. Nur ein Tool, das ODT-Dateien generiert, die ich dann in LibreOffice mit Anmerkungen versehen kann (z. B. um Formulare auszufüllen).

Ich weiß, wie man das manuell macht, indem man das PDF-Dokument in Grafikdateien konvertiert und sie dann in LibreOffice importiert, aber das wird ziemlich schnell mühsam.

Also habe ich endlich ein schnelles kleines Shell-Skript geschrieben, das alle erforderlichen Schritte automatisch ausführt. Sie finden es unter https://github.com/gutschke/pdf2odt

Es kann eine beliebige Anzahl von PDF- und Bilddateien als Eingabe verwenden und generiert eine ODT-Datei, die in LibreOffice geöffnet und bearbeitet werden kann. Bilder werden als Seitenhintergrund angezeigt, sodass Sie frei darüber schreiben können. Jedes Bild ist einem eigenen Seitenstil zugeordnet. Denken Sie daran, wenn Sie Seitenumbrüche einfügen, und passen Sie den Seitenstil nach Bedarf an.

Ich habe das Skript sowohl auf Linux als auch auf Mac getestet. Da es nur eine Handvoll Standardwerkzeuge benötigt, sollte es durchaus portabel sein.

gutschke
quelle
Dieses Skript macht Screenshots von jeder Seite und zeichnet sie im Zielformat auf. Danke für das Skript Gutschke
Oliver
Ich hatte vor pdf2ooein paar Jahren verwendet, aber es scheint jetzt korrupte Dateien für LibreOffice zu produzieren. Dieses Skript macht das und mehr - danke!
Eacousineau
3
Das pdf2odt-Skript konvertiert leider in ein Bildformat, das als ODT-Hintergrund verwendet wird. Erwarten Sie nicht, den Originaltext "bearbeiten" zu können.
Richard Elkins
13

Sie könnten einen Blick darauf werfen PDF Utilities(Poppler-Utils über Synaptic oder apt-get), der pdftotext enthält :

Poppler ist eine PDF-Rendering-Bibliothek, die auf Xpdf PDF Viewer basiert.

Dieses Paket enthält Befehlszeilen-Dienstprogramme (basierend auf Poppler) zum Abrufen von Informationen aus PDF-Dokumenten, zum Konvertieren in andere Formate oder zum Bearbeiten dieser:
* pdfdetach - Listet eingebettete Dateien (Anhänge) auf oder extrahiert sie.
* Pdffonts - Font Analyzer
* pdfimages - Bild Extraktor
* pdfinfo - Dokumentinformationen
* pdfseparate - Seite Extraktionswerkzeug
* pdftocairo - PDF to PNG / JPEG / PDF / PS / EPS / SVG - Wandler Kairo mit
* pdftohtml - PDF zu HTML - Konverter
* pdftoppm - PDF zu PPM / PNG / JPEG Bildkonverter
* pdftops - PDF zu PostScript (PS) Konverter
* pdftotext -
Textextraktion * pdfunite - Tool zum Zusammenführen von Dokumenten

Der Erfolg hängt natürlich davon ab, wie die PDF-Datei erstellt wurde. Wenn Sie das Gewünschte als Textdatei erhalten, können Sie diese als ODT-Datei speichern.

Bearbeiten: Ich habe vergessen, die Quelle für das Angebot anzugeben. Es ist von der Registerkarte Beschreibung in Synaptic fürPDF Utilities (based on Poppler).


quelle
3
Aus dieser Liste pdftohtmlmuss die beste für die Aufgabe sein, da HTML Formatierungen tragen kann. Dann könnte HTML in ODT oder DOC konvertiert werden.
imz - Ivan Zakharyaschev
10

Libreoffice ist in der Lage zu importieren .pdfDateien. Öffnen Sie es einfach in einer aktuellen Version von LibreOffice, um die besten Ergebnisse zu erzielen. Das Dokument wird jedoch als Zeichnung geöffnet, und Sie können es nur in eines der unterstützten Bildformate konvertieren, nicht in ein Writer-Dokument.

Natürlich bleiben nicht alle Formatierungen erhalten, aber zumindest einige.

Bieger
quelle
1
Ich habe es kürzlich versucht, und es ist schrecklich, es spart nicht einmal ein bisschen Formatierung. Außerdem macht es Text überhaupt nicht lesbar.
Hallo-Engel
3

Wenn das Paket poppler-utils installiert ist, kann das folgende Nautilus-Skript (das als ausführbare Datei im Ordner ~ / .gnome2 / nautilus-scripts abgelegt wird) zum Konvertieren der PDF-Datei in HTML verwendet werden (Option "-i" kann zum Einschließen gelöscht werden (auch Bilder), die dann mit LibreOffice Writer geöffnet und als ODT gespeichert werden können, obwohl der Erfolg der Formatierungskonvertierung stark davon abhängt, wie PDF erstellt wird.

http://ubuntuone.com/6xI1afyu6QdQvgdCGn0kym

Sadi
quelle
Vielen Dank für dieses hilfreiche Skript. Nur eine kleine Bemerkung (von man pdftohtml): -noframes : generate no frames. Not supported in complex output mode.Also -noframeswird mit -cset keine Wirkung haben.
Glutanimate
2
Danke, ich habe diese überflüssige Option jetzt aus meinem Skript entfernt. Ein Zenity-bash-Skript, das eine GUI für all diese Optionen bereitstellt, scheint sehr schön zu sein ;-)
Sadi
#MHC, es scheint, dass diese Informationen falsch sind; Wenn wir -noframes nicht einschließen, erhalten wir separate HTML-Dateien für PDF-Seiten. Also habe ich es wieder in mein Skript eingefügt.
Sadi
Das ist merkwürdig. Muss dann ein Fehler in der Dokumentation sein. Ich werde meine Kopie des Skripts entsprechend ändern. Vielen Dank für die Köpfe hoch!
Glutanimate
3

Probieren Sie Calibre. Es konvertiert in HTML und dann in andere Formate. Bei einer großen (183 Seiten) Datei, die ich sonst hätte drucken müssen, hat es ziemlich gute Arbeit geleistet.

In meinem Fall habe ich es in ein Epub konvertiert, aber zum Spaß habe ich es einfach in eine .docx konvertiert, was sich als sehr gut herausgestellt hat.

Christopher
quelle