Gibt es ein Befehlszeilentool zum Durchsuchen einer docx-Datei per Text? Ich habe es versucht grep
, aber es funktioniert nicht mit docx, obwohl es gut mit txt- und xml-Dateien funktioniert. Ich könnte das docx zuerst in txt konvertieren, aber ich würde ein Tool bevorzugen, das direkt mit docx-Dateien arbeitet. Ich brauche das Tool, um unter Cygwin zu arbeiten.
OP-Bearbeitung: Später fand ich heraus, dass der einfachste Weg, um das grep zu erreichen, darin besteht, diese docx in txt zu konvertieren und sie dann zu grep.
grep
search
cygwin
microsoft-word
Gob00st
quelle
quelle
Antworten:
Ich kenne mehrere Indizierungswerkzeuge, die Word-Dokumente unterstützen. Mit solchen Tools können Sie Dokumente indizieren und dann effizient nach Wörtern im Index suchen. Sie erlauben keine Volltextsuche.
quelle
DOCx ist komprimiert und kein Textformat. Was Sie also brauchen, ist zuerst ein Konverter . Danach können Sie den
find
Befehl für die konvertierten Dateien verwenden.quelle
grep
?Hast du dir Openoffice Ninja angesehen ?
(weiß nichts über Cygwin-Unterstützung)
quelle