Wie man eine wirklich große HTML-Datei in Windows in PDF konvertiert [geschlossen]

7

Wir haben einige wirklich große HTML-Dateien (60-100 MB), die wir nicht zuverlässig in PDF konvertieren können.

Adobe Acrobat 9 stürzt ab - erreicht die 2-GB-Grenze für Anwendungen.

Open Office konvertiert, entfernt jedoch einige der Anker ().

ActivePDF Webgrabber stürzt ab.

Ist die Verwendung einer 64-Bit-Situation eine Option für diese Art von Dingen?

Ich sehe eine Reihe von Optionen, aber können sie besser als Adobe Acrobat 9 selbst sein?

PeterStrange
quelle
Ziemlich gute Frage. Ich bin überrascht, dass dies geschlossen wurde.
Filip

Antworten:

5

Haben Sie wkhtmltopdf ausprobiert ? Es ist ein Befehlszeilenprogramm, das sehr einfach zu bedienen ist: wkhtmltopdf:

Installieren Sie wkhtmltopdf.
Gehen Sie zu Start -> Ausführen -> cmd

cd %Program Files%\wkhtmltopdf                     [press enter]
wkhtmltopdf.exe http://www.google.com google.pdf   [press enter]

Viola. google.com in google.pdf gespeichert.

Wenn ich mich richtig erinnere, funktioniert es ziemlich gut mit seiner PDF-Komprimierung

David Murdoch
quelle
1
Funktioniert wirklich realistisch. Ich habe jedoch einige Fehler festgestellt (da der WebKit-Browser intern verwendet wird), wobei Tabellenüberschriften auf jeder PDF-Seite wiederholt wurden und Tabelleninhalte überschrieben wurden.
Filip
2

Die einzige Möglichkeit, dieses Problem zu lösen, bestand darin, HTML-Teile in PDF zu konvertieren und sie dann in Adobe Acrobat 9 zusammenzuführen.

Vielen Dank für Ihre Vorschläge. Wirklich interessantes Lernen über all diese netten Werkzeuge, die es gibt.

PeterStrange
quelle
1

Sie können den PDF-Ersteller von FoxIt ausprobieren . Es ist nur 30 $ und sie haben eine Testversion, so dass Sie sehen können, ob es den Job machen wird. Ihr Leser ist meiner Meinung nach viel besser als der von Adobe, daher würde ich mir vorstellen, dass ihr Autor auf derselben Engine basiert.

Andere kostenlose Optionen, die Sie ausprobieren können, sind pdfcreator oder pdfill .

3dinfluence
quelle
Danke, ich habe es versucht und nach 20 Stunden hat es den Job vom IE gemacht. Es wurden jedoch keine Links oder benannten Ziele erstellt, sodass dies kein Problem ist.
PeterStrange
1

Abhängig vom Anwendungsfall und wenn Sie den HTML-Code sogar in einem Viewer anzeigen könnten, könnten Sie an PrimoPDF denken . "Print-to-PDF" -Technologien sind möglicherweise nicht unbedingt ideal, können jedoch die Größenbelastung verringern.

Mike B.
quelle
PrimoPDF scheint für HTML mit etwa 3000 Seiten fehlzuschlagen.
Filip
1

Kennen Sie jemanden mit einem Mac? Wenn ja, lassen Sie sie es mit Vorschau öffnen und als PDF drucken.

Chopper3
quelle
1

Warum sind die HTML-Dateien so groß - sind sie Dateien, die Sie von Dritten erhalten, oder werden sie von etwas in Ihrer Organisation generiert? Könnten Sie ein Skript schreiben, um die HTML-Dateien in Abschnitte aufzuteilen? Haben sie Links zu Bildern? Könnte Ihr Skript die Qualität der Bilder verringern, um die Dateigröße zu verringern?

David Hicks
quelle
Es ist nur ein großes Dokument. Ich könnte es aufteilen, aber dann wäre die Verknüpfung ein Problem. Keine nennenswerten Bilder. :(
PeterStrange
Schreiben Sie ein Skript, um den HTML-Code mit Python und ReportLab selbst in PDF zu konvertieren?
David Hicks
1

Ich habe mit PDF995 ziemlich lange Webseiten als PDF gedruckt . Sicher nicht so groß wie du redest, aber es hat bei mir sehr reibungslos funktioniert.

Hometoast
quelle
1

Ich weiß, dass dies etwas ketzerisch sein könnte. Könnten Sie: Kopieren Sie es und fügen Sie es in Word ein. Verwenden Sie dann Word, um das HTML-Dokument zu erstellen. Verwenden Sie dann erneut Word, um das Dokument als PDF zu speichern. Nur eine Out-of-the-Box-Idee.

lilott8
quelle
No Go. Offenbar zu groß für Word!
PeterStrange
1

Wenn Sie dieses Problem haben, versuchen Sie, HTMLTidy zu verwenden, um den HTML-Code zu bereinigen. Das hat die Größe um ein Vielfaches verringert und die Arbeit erleichtert!

PeterStrange
quelle