Warum kann ich eine .bz2-Datei nicht mit tar dekomprimieren?

30

Also habe ich diesen Wikipedia-Dump mit einer Größe von ungefähr 10 GB und dem Namen "enwiki-latest-pages-articles.xml.bz2". Ich habe die folgenden Befehle im Terminal versucht, um den Speicherauszug zu entpacken:

tar jxf enwiki-latest-pages-articles.xml.bz2

Und

tar xvf enwiki-latest-pages-articles.xml.bz2

Beide geben jedoch den folgenden Fehler zurück

tar: This does not look like a tar archive
tar: Skipping to next header
Arun Mohan
quelle
1
Führen Sie den folgenden Befehl aus und fügen Sie die Ausgabe "file enwiki-latest-pages-articles.xml.bz2"
PKumar
Dieses Q / A kann helfen, nutzen Sie 7zutil zum Extrahieren von allem
c0rp
2
Ich stelle fest, dass Sie sagen, dass dies eine riesige Datei ist. Eine weitere Möglichkeit besteht darin, sie in etwas zu leiten: bzcat enwiki-latest-pages-articles.xml.bz2 | someotherprogram
nwaltham
@nwaltham: Du hättest mein Votum, wenn du das beantwortet hättest.
Ilmari Karonen
Weil tar tar-Dateien extrahiert und es keine tar-Datei ist?
user253751

Antworten:

71

Sie können den tarBefehl nicht verwenden, da das Archiv keine .tar. * -Datei ist. Verwenden Sie den folgenden Befehl, um eine bzip2-Datei zu dekomprimieren (dabei wird die ursprüngliche .bz2-Datei nicht beibehalten):

bzip2 -d enwiki-latest-pages-articles.xml.bz2

Wenn Sie es extrahieren und das Original behalten möchten, führen Sie den folgenden Befehl aus:

bzip2 -dk enwiki-latest-pages-articles.xml.bz2

Quelle: https://superuser.com/questions/480950/how-to-decompress-a-bz2-file

Terrance8D
quelle
3
Oder benutze bunzip2.
user253751
@immibis So oder so funktioniert. :)
Terrance8D
21

Verwenden Sie einfach bunzip2:

bunzip2 enwiki-latest-pages-articles.xml.bz2

Und wenn es eine gzipkomprimierte Datei ist:

gunzip enwiki-latest-pages-articles.xml.gz
Chaos
quelle