Ähnlichkeit und / oder Diff zweier ODT-Dokumente (Linux)

14

Ich habe zwei ODT-Dokumente, die sehr nahe beieinander liegen. Ich möchte sie vergleichen, um festzustellen, wie ähnlich sie sind.

Das Beste wäre, einen Ähnlichkeitsprozentsatz zu haben , wenn dies nicht möglich ist. Eine Alternative wäre, zumindest eine Art Diff zu haben .

Ich verwende Ubuntu Lucid .


Lösung:

Früher habe ich odt2txtdie Dateien in Text konvertiert und dann wdiff -i --statistics one.txt two.txtein Diff zusammen mit Statistiken verwendet, die mir den Prozentsatz der gebräuchlichen Wörter (Ähnlichkeit) angaben.

Weboide
quelle

Antworten:

7

Ich habe sie selbst nicht ausprobiert, aber dieses Toolpaar - odt2txt und oodiff - sieht vielversprechend aus.

JRobert
quelle
Ich habe odt2txt verwendet, um sie in Text umzuwandeln, und dann wdiff verwendet, das einen Unterschied nach Wort ergibt.
Weboide
Vielen Dank. Dies ist ideal für den Einsatz in Versionskontrollsystemen wie Git oder Mercurial. Siehe Integration / Automatisierungstechniken bei OpenDocument, diff und Revisionskontrolle
nealmcb
20

Haben Sie die eingebaute Vergleichsfunktion ausprobiert? Dokument bearbeiten / vergleichen ...

Wenn Sie nur einen textuellen Vergleich wünschen, ist es wahrscheinlich Ihre beste Wahl, beide Dokumente in einfachen Text umzuwandeln und dann einen regulären Vergleich für sie durchzuführen. Sie müssen jedoch herausfinden, wie Sie Zeilenumbrüche normalisieren können, da sonst das Diff nicht sehr nützlich ist.

sleske
quelle
1
Tolle Funktion in LibreOffice, ich hatte noch nie davon gehört! Sehr nützlich, aber es werden keine Statistiken angegeben.
stragu
Ausgezeichnet! Ich hätte nie gedacht, in ein Bearbeitungsmenü zu schauen , um Dokumente zu vergleichen. Ich habe in Datei , Tools und Fenster gesucht, wobei der letzte der Word-Speicherort von uSoft war.
Wallyk
4
In der neuesten Version scheint es sich um Bearbeiten -> Änderungen
nachverfolgen
1

Wenn Sie sich nicht für die Textformatierung interessieren, können Sie den Inhalt auch in Klartextdateien kopieren und gutes altes Diff verwenden.

ps: Bist du ein Lehrer, der nach möglichen Betrügern sucht? : p

tamtakos
quelle
lol nein, ich bin kein Lehrer, aber ja, dies wäre eine gute Möglichkeit, nach Betrügern zu suchen :)
Weboide
1

Dazu erstelle ich mit libreoffice PDF-Dateien und vergleiche die beiden PDF-Dateien mit diffpdf. Dies zeigt die in parallelen Fenstern hervorgehobenen Unterschiede

Peter Allott
quelle