Heute habe ich versehentlich herausgefunden, dass die .docx die gleiche .zip ist (oder es gibt keinen großen Unterschied zwischen ihnen). Wenn Sie die DOCX-Datei in die ZIP-Datei ändern und mit WinRAR öffnen, werden in den Ordnern eine Reihe von XML-Dateien angezeigt. In dieser XML-Datei werden Text, Schriftarten, Eigentümer, zuletzt geänderte Informationen usw. gespeichert. Mit einem Wort, alle Informationen werden als XML-Daten gespeichert.
Das Gleiche gilt jedoch nicht für DOC-Erweiterungsdateien. Es ist unmöglich, sie als .zip op als .rar zu öffnen.
Frage: Was ist der Vorteil des Speicherns von .docx-Daten in XML, den Microsoft beim Speichern von Daten geändert hat? In der Tat möchte ich nicht den Vorteil des XML-Formats kennen, sondern warum Microsoft mehrere XML-Dateien zum Speichern der DOCX-Daten verwendet. Es stellt sich heraus, dass .docx kein neues Format im Stammverzeichnis ist.
quelle
Antworten:
In einer
.docx
Datei können eingebettete Ressourcen wie Bilddateien und nicht nur XML-Dateien gespeichert werden. Anstatt Dinge in base64 oder so zu codieren und in einer XML-Datei zu speichern oder ein weiteres binäres Serialisierungsformat zu erfinden, entschieden sie sich für das Standard-ZIP-Format.Außerdem ist XML ein sehr ausführliches Dateiformat, das viele redundante Muster enthält. Sie können eine hohe Komprimierungsrate für XML-Dateien erhalten.
Übrigens verstehe ich den Teil "uns betrügen" nicht wirklich. Ist es besser, ein neues kryptisches Dateiformat von Grund auf neu zu erfinden oder ein bekanntes Standardformat zu verwenden?
quelle
Der Wikipedia-Artikel fasst es ziemlich gut zusammen:
"Microsoft geriet zunehmend unter Druck, ein offenes Dateiformat einzuführen, insbesondere mehrere Nationen verabschiedeten Regeln, wonach offizielle Dokumente in einem offenen Format vorliegen sollten."
Bearbeiten: Und das Zippen macht sehr viel Sinn, da das XML sehr ausführlich ist und natürlich sehr gut komprimiert wird.
quelle
Die Verwendung einer umbenannten ZIP-Datei ist eine weit verbreitete Praxis. Beispielsweise sind Quake III-Pak-Dateien wirklich ZIP-Dateien. Es macht keinen Sinn, ein eigenes komprimiertes Dateiformat zu erfinden, wenn bereits vollkommen gute vorhanden sind.
quelle
.jar
, Winamp.wsz
/.wal
(Skins), Firefox.xpi
(XPInstaller - Themes, Addons). (tar
Archive sind auch beliebt.)Es ist nicht nur Office Open XML, das komprimiertes XML verwendet. OpenDocument von Open Office macht dasselbe hinter den Kulissen.
Auf der Wikipedia-Seite der Open Packaging Conventions sind einige Vorteile aufgeführt :
quelle
Der größte Vorteil ist, dass Sie auf Ihre Daten zugreifen können, indem Sie die Datei entpacken und den Text aus den XML-Dateien kopieren. Dies kann mit einem Zip-Dienstprogramm und einem Texteditor erfolgen, auch wenn Sie keine Kopie von Word 2007 haben.
Dies macht das Format offener als die älteren Binärformate.
quelle