Manchmal scheinen Word-Dokumente mehr oder weniger kaputt zu sein, normalerweise wenn das Layout ziemlich komplex geworden ist und das Dokument mehrmals den Besitzer und / oder die Version gewechselt hat. Symptome können sein, dass beim Drücken der Tasten Backspaceoder Enteran einer bestimmten Stelle des Dokuments, an der es wirklich funktionieren sollte, nichts passiert oder dass die Formatierung mehr oder weniger zufällig angewendet wird und sich selbst zurücksetzt. Ich denke, wir waren alle dort.
Oft kann es sehr schwierig sein, genau zu wissen, was falsch ist, da das, was in Word unter der Haube passiert, ziemlich undurchsichtig ist. Sie könnten ein Dokument haben, das leer aussieht, aber in Wirklichkeit kann der zugrunde liegende Zustand in Bezug auf Formatierung usw. ziemlich komplex sein.
In diesen Fällen wäre es nützlich, einen Blick auf den Quellcode hinter dem zu werfen, was auf der Seite angezeigt wird. B. wie Sie in einem Browser View Source ausführen und im Idealfall Änderungen direkt im Quellcode vornehmen können, wie Sie es bei Verwendung von Latex tun würden. Gibt es einen Befehl oder ein Dienstprogramm vom Typ "Quelltext anzeigen" für Microsoft Word-Dokumente?
Ich vermute, dass es keinen solchen Befehl gibt, sonst hätte ich davon gehört. Wenn dies der Fall ist, hat jemand einen guten Ansatz, um lästige "versteckte Formatierungen" in einem Word-Dokument in den Griff zu bekommen ?
Ich vermute, dass es einige Unterschiede in den Formaten .doc und .docx gibt. Ich interessiere mich für beide Fälle.
quelle
Ich denke, das DOC-Format ist ziemlich schwierig, daher kann ich Ihnen hier nicht helfen. .Docx ist jedoch eine Zip-Datei, in der alle Details in XML-Dateien gespeichert sind. Benennen Sie die Datei daher in .zip um und sehen Sie sich die Quelle an!
quelle
Wenn es um ein Binärformat wie * .doc geht, sind die Dinge schwieriger. Sie können den mso-Dumper von LibreOffice verwenden . Klonen Sie einfach die Lösung auf Ihren lokalen Computer und führen Sie sie aus
Jetzt werden alle Elemente in der Binärdatei in genau dem im Word (.doc) Binary File Format beschriebenen Format in XML konvertiert
Es gibt auch WordFileDump, das einfacher, aber nicht so leistungsfähig wie mso-dumper ist
Leider dienen diese nur zur Analyse der Struktur und es gibt kein Tool, um die XML-Ausgabe wieder in eine * .doc-Datei zusammenzusetzen. Wenn Sie also die Hauptursache gefunden haben, müssen Sie sie mit Word bearbeiten. Daher ist es einfacher, in * .docx zu konvertieren, die * .docx-Datei zu untersuchen und bei Bedarf wieder in * .doc zu konvertieren
Sie können die Datei auch als RTF speichern, bei der es sich um eine "lesbare" Textdatei anstelle von Office-XML handelt. Alternativ können Sie die Word-Datei auch als HTML speichern
quelle