Gibt es einen Weg zu cat
oder less
eine ODT-Datei genauso wie antiword
für DOC-Dateien?
Gibt es einen Weg zu cat
oder less
eine ODT-Datei genauso wie antiword
für DOC-Dateien?
Die Lösung nutzt odt2txt
. Dieser Befehl wird nun von zwei verschiedenen Paketen bereitgestellt, nämlich einem odt2txt
, mit dem Sie installieren können
sudo apt-get install odt2txt
und durch das Paket unoconv
(das auch Befehlszeilenkonvertierungen zwischen mehr libreoffice-Formaten bietet), das von installiert wird
sudo apt-get install unoconv
Wenn Sie die beiden haben, können Sie mit dem alternativen Mechanismus zwischen ihnen wechseln :
sudo update-alternatives --config odt2txt
Wenn Sie das odt2txt
vom Paket bereitgestellte verwenden, verwenden odt2txt
Sie einfach
odt2txt file.odt
Wenn Sie das unoconv
mitgelieferte Paket verwenden, müssen Sie verwenden
odt2txt --stdout file.odt
Pipe sie, less
um eine weniger ähnliche Erfahrung zu haben ( odt2txt file.odt | less
)
Beachten Sie --stdout
, dass das von Unoconv bereitgestellte Paket das Ergebnis in eine aufgerufene Datei schreibt , wenn Sie die Option nicht verwenden file.txt
.
Das von der Distribution vorgeschlagene Paket scheint das aus dem odt2txt
Paket zu sein (es hat im alternativen System eine höhere Standardpriorität). Sicher hat es weniger Abhängigkeiten.
odt2txt
Paket installiert und es verhält sich so, wie es sollte.unoconv
Wie ich festgestellt habe, besteht das Problem darin , dass eine ältere Version von Libre Office installiert werden soll, wenn eine neuere installiert ist. Deshalb bleib beisudo apt install odt2txt
.update-alternatives
, danke.Sie können Text ohne spezielles Hilfsprogramm durchsuchen. ODT-Datei ist ein umbenanntes Zip-Archiv. Entpacken Sie es und Sie werden mehrere Dateien sehen. Eine davon
content.xml
enthält den gesamten Text und istmore
oderless
lesbar.quelle
odt2txt file.odt
Der Quellcode und die Compilebale Working Zip können hier heruntergeladen werden:
https://github.com/dstosberg/odt2txt/
oder installiert von
sudo apt-get install odt2txt
quelle
Sie können nicht
cat
oderless
odermore
eine ODT-Datei, weil es eine Binärdatei ist. Tatsächlich handelt es sich - wie bereits erwähnt - um ein umbenanntes ZIP-Archiv, sodass Sie diecontent.xml
Datei extrahieren müssen. Dies bedeutet jedoch, dass es sich um ein XML-Dokument handelt. Sie müssen es also als solches verarbeiten, um die Informationen daraus zu extrahieren.quelle