Grep in Microsoft Word?
Ich möchte alle Zeilen mit einer bestimmten Zeichenfolge aus einem Word-Dokument ziehen. In der Unix-Welt ... macht grep dies ohne einen Fehler. Windows ist für mich weniger als offensichtlich.
microsoft-word
grep
fretje
quelle
quelle
catdoc
Segfaults für jede.doc
/.docx
Datei, die ich gebe, undantiword
sagt mir nur, dass mein Dokument "kein Word-Dokument ist". Kennen Sie andere Möglichkeiten?docx2txt
es in Debian-Repositorys existiert - könnte funktionieren. Ich würde auch das OpenOffice / LibreOffice-Dienstprogramm zur Konvertierung des Befehlszeilenformats (unoconv) untersuchen, das für denselben Zweck verwendet werden könnte.Ich weiß, das klingt primitiv, aber was hindert Sie daran, die Datei als .txt zu speichern und sie dann nach Ihren Wünschen auseinander zu reißen.
quelle
Was bedeutet "Linie" in einem Word-Kontext? Die angezeigte Zeile, die sich ändert, wenn Sie etwas an der Seitenformatierung ändern? Der Paragraph? Etwas anderes?
Mit den Such- und Ersetzungsfunktionen von Word können Sie eine Reihe von Aufgaben erledigen, einschließlich der Änderung der Formatierung und anderer nicht offensichtlicher Dinge. Alle Funktionen wirken sich jedoch nur auf den Find-What-Text selbst aus, nicht auf umgebenden Text.
quelle
In CRGREP, das ich als kostenloses OpenSource-Tool entwickelt habe, werden MS-Dokumente - Word, PowerPoint, Excel - unterstützt . Es greift auch andere schwer zu durchsuchende Dinge wie Datenbanktabellen, Bilder, Audio, Archive, PDF und Kombinationen davon auf. Habe Spaß.
quelle
PowerGREP tut genau das für Sie, und zwar schnell - aber nicht frei. Meiner Meinung nach ist es jeden Cent wert. Außerdem gibt es eine kostenlose 30-Tage-Testversion.
quelle
Ich habe nicht genug Repräsentanten, um einen Kommentar abzugeben, aber ich kann sehen, dass dieses Problem zwischen doc und docx besprochen wurde, sodass jeder, der den Thread verfolgt (wie ich es war), dies hilfreich finden kann.
Für docx-Dateien benötigen Sie kein spezielles Tool. docx sind komprimierte XML-Dateien.
Um das XML zu extrahieren und zu entfernen, versuchen Sie etwas basierend auf
von der Kommandozeile fu
quelle
Schnelle, kostenlose, Open Source- und plattformübergreifende Lösung: https://github.com/phiresky/ripgrep-all
quelle