Befehlszeilentool zum Durchsuchen von docx-Dateien

9

Gibt es ein Befehlszeilentool zum Durchsuchen einer docx-Datei per Text? Ich habe es versucht grep, aber es funktioniert nicht mit docx, obwohl es gut mit txt- und xml-Dateien funktioniert. Ich könnte das docx zuerst in txt konvertieren, aber ich würde ein Tool bevorzugen, das direkt mit docx-Dateien arbeitet. Ich brauche das Tool, um unter Cygwin zu arbeiten.

OP-Bearbeitung: Später fand ich heraus, dass der einfachste Weg, um das grep zu erreichen, darin besteht, diese docx in txt zu konvertieren und sie dann zu grep.

Gob00st
quelle
Verwandte Stackoverflow-Antwort .
jw013
Ich habe den DOS-Teil losgeworden, da das hier nicht zum Thema gehört
Michael Mrozek
Verwandte: Befehlszeilenfreundliche Volltextindizierung?
Gilles 'SO - hör auf böse zu sein'

Antworten:

3

Ich kenne mehrere Indizierungswerkzeuge, die Word-Dokumente unterstützen. Mit solchen Tools können Sie Dokumente indizieren und dann effizient nach Wörtern im Index suchen. Sie erlauben keine Volltextsuche.

Gilles 'SO - hör auf böse zu sein'
quelle
1

DOCx ist komprimiert und kein Textformat. Was Sie also brauchen, ist zuerst ein Konverter . Danach können Sie den findBefehl für die konvertierten Dateien verwenden.

Nils
quelle
Oder Sie können ein Suchwerkzeug verwenden, das komprimierte Dateien lesen kann. In deinem letzten Satz hast du wohl gemeint grep?
Gilles 'SO - hör auf böse zu sein'
@ Gilles - Sehen Sie sich den Originaltitel der Frage an, bevor Michael sie bearbeitet hat. Dies schien eine Frage zu DOS zu sein (und ich habe sie als nicht thematisch gekennzeichnet).
Nils