Vorteile des DOCX-Formats gegenüber DOC

9

Heute habe ich versehentlich herausgefunden, dass die .docx die gleiche .zip ist (oder es gibt keinen großen Unterschied zwischen ihnen). Wenn Sie die DOCX-Datei in die ZIP-Datei ändern und mit WinRAR öffnen, werden in den Ordnern eine Reihe von XML-Dateien angezeigt. In dieser XML-Datei werden Text, Schriftarten, Eigentümer, zuletzt geänderte Informationen usw. gespeichert. Mit einem Wort, alle Informationen werden als XML-Daten gespeichert.

Das Gleiche gilt jedoch nicht für DOC-Erweiterungsdateien. Es ist unmöglich, sie als .zip op als .rar zu öffnen.

Frage: Was ist der Vorteil des Speicherns von .docx-Daten in XML, den Microsoft beim Speichern von Daten geändert hat? In der Tat möchte ich nicht den Vorteil des XML-Formats kennen, sondern warum Microsoft mehrere XML-Dateien zum Speichern der DOCX-Daten verwendet. Es stellt sich heraus, dass .docx kein neues Format im Stammverzeichnis ist.

Narek
quelle
Innerhalb von 1 Minute .. 5 fast gleiche Antworten. Die Kraft von SO.
MRG
1
Daten im XML-Format zu haben bedeutet nicht, dass es sich nicht um ein neues Format handelt. Sie können dieses XML nicht in OpenOffice einspeisen und es korrekt rendern lassen. Sie müssen klar definieren, was XML-Struktur sein wird, welche Attribute, welche Elemente usw.
1
Ändern Sie den Titel in einen informativeren Titel.
Carl Bergquist
2
Natürlich ist es ein neues Format. Komm jetzt.
Liebe Janis Veinbergs und Kyle Rozendo Ich habe viele Male mit XML und XSD gearbeitet und weiß, wie es funktioniert !!! Sei aufmerksam, ich sagte "in der Wurzel". Sie können nicht zustimmen, dass es sich um das gerade verwendete XML-Format handelt, nicht um ein neues Format !!!!
Narek

Antworten:

12

In einer .docxDatei können eingebettete Ressourcen wie Bilddateien und nicht nur XML-Dateien gespeichert werden. Anstatt Dinge in base64 oder so zu codieren und in einer XML-Datei zu speichern oder ein weiteres binäres Serialisierungsformat zu erfinden, entschieden sie sich für das Standard-ZIP-Format.

Außerdem ist XML ein sehr ausführliches Dateiformat, das viele redundante Muster enthält. Sie können eine hohe Komprimierungsrate für XML-Dateien erhalten.

Übrigens verstehe ich den Teil "uns betrügen" nicht wirklich. Ist es besser, ein neues kryptisches Dateiformat von Grund auf neu zu erfinden oder ein bekanntes Standardformat zu verwenden?

Mehrdad Afshari
quelle
Der Hauptvorteil, den ich sehe, ist, dass es Open APIs gibt, mit denen diese Dateien tatsächlich erstellt werden können. Daher ist es möglich, DOCX-Dateien von Grund auf neu zu erstellen, ohne viel Geld für proprietäre SDKs auszugeben. Das Microsoft SDK bietet sogar einen Dokumentreflektor, der C # -Code generiert, um ein vorgefertigtes Dokument von Grund auf neu zu generieren.
Will Eddins
@ Guard: Ja. Meine Antwort bezieht sich auf die Originalversion der Frage. Die Frage hat sich seitdem erheblich geändert;) Der ursprüngliche Titel lautete "Microsoft betrügt?"
Mehrdad Afshari
xml an sich macht ein Format nicht "bekannt", wobei .docx eines der besten Beispiele ist.
artistoex
5

Der Wikipedia-Artikel fasst es ziemlich gut zusammen:

"Microsoft geriet zunehmend unter Druck, ein offenes Dateiformat einzuführen, insbesondere mehrere Nationen verabschiedeten Regeln, wonach offizielle Dokumente in einem offenen Format vorliegen sollten."

Bearbeiten: Und das Zippen macht sehr viel Sinn, da das XML sehr ausführlich ist und natürlich sehr gut komprimiert wird.

Henning
quelle
3
"Öffnen" bedeutet nicht "kann entpackt werden".
Greg Hewgill
3
Das Zippen hat neben der Komprimierung noch weitere Vorteile. Es fungiert auch als Container für mehrere Dateien.
Joey
3

Die Verwendung einer umbenannten ZIP-Datei ist eine weit verbreitete Praxis. Beispielsweise sind Quake III-Pak-Dateien wirklich ZIP-Dateien. Es macht keinen Sinn, ein eigenes komprimiertes Dateiformat zu erfinden, wenn bereits vollkommen gute vorhanden sind.

Greg
quelle
1
Weitere Beispiele für die Verwendung von ZIP-Archiven: Java .jar, Winamp .wsz/ .wal(Skins), Firefox .xpi(XPInstaller - Themes, Addons). ( tarArchive sind auch beliebt.)
user1686
1

Es ist nicht nur Office Open XML, das komprimiertes XML verwendet. OpenDocument von Open Office macht dasselbe hinter den Kulissen.

Auf der Wikipedia-Seite der Open Packaging Conventions sind einige Vorteile aufgeführt :

Indirektion

Nehmen Sie das Beispiel eines Katalogs, in dem ein Logo 1.000 Mal wiederholt wird. Wenn wir mithilfe eines Indirektionsmechanismus das Logo ändern möchten, müssen wir nur einen Eintrag in einer Datei ändern, ohne dass eine Suche erforderlich ist, da wir wissen, wo wir suchen müssen. Dies erhöht die Wartbarkeit erheblich. Wenn Sie beispielsweise das Layout der ZIP-Verzeichnisse ändern möchten, in denen Ihre Dateien gespeichert sind, ist dies eine triviale Angelegenheit, da Sie nicht jedes Element kennen müssen, das auf eine Datei verweisen kann. Sie befinden sich alle an einer Stelle.

Chunking

Es ermutigt Dokumente, in kleine Stücke aufgeteilt zu werden. Dies ist besser, um die Auswirkungen der Dateibeschädigung zu verringern. Und besser für den Datenzugriff: Zum Beispiel alle Stilinformationen in einem XML-Teil, jedes separate Arbeitsblatt oder jede Tabelle in ihren eigenen Teilen. Dies ermöglicht einen schnelleren Zugriff und eine geringere Objekterstellung für Clients und erleichtert es mehreren Prozessen, an demselben Dokument zu arbeiten.

Chunking kommt auch Programmierern zugute. Das Ersetzen eines Stylesheets durch ein anderes wird zu einer ZIP-Dateioperation und nicht zu einer XML-Operation. Und es reduziert die Menge an Dingen, die ein Programmierer verstehen muss, weil er sich den Blöcken nähern kann, vorausgesetzt, dass sich alle Informationen zu einem Thema in diesem Block befinden: Ihnen wird die mentale Mühe erspart, eine große Datei mit vielen durchsuchen zu müssen fremde Elemente.

Relative Indirektion

In den Open Packaging-Konventionen hat jede Datei mit Referenz eine eigene _rels-Datei mit den Indirektionslisten. Dies erleichtert das Ausschneiden und Einfügen einiger Informationen mit allen zugehörigen Ressourcen in einigen Fällen, bietet Namensbereiche, um die Möglichkeit von Namenskonflikten zwischen Dateien zu beseitigen, und so weiter.

Joey
quelle
0

Der größte Vorteil ist, dass Sie auf Ihre Daten zugreifen können, indem Sie die Datei entpacken und den Text aus den XML-Dateien kopieren. Dies kann mit einem Zip-Dienstprogramm und einem Texteditor erfolgen, auch wenn Sie keine Kopie von Word 2007 haben.

Dies macht das Format offener als die älteren Binärformate.

Joe Internet
quelle