Auf unseren Servern läuft Ubuntu Linux, und die Binärdatei ist ein BSON-Dump einer großen MongoDB-Sammlung. Wie zuverlässig ist ein Werkzeug split
? Gibt es einen schnelleren oder besseren Weg, dies zu tun?
26
Um zu teilen, teilen Sie -b
Einfach mitmachen cat
.
AFAIK sie sind absolut zuverlässig, und ich bezweifle, dass es etwas effizienteres gibt.
split ist sehr zuverlässig. Wir verwenden es zum Portieren großer Protokolldateien, und es funktionierte gut für bis zu ein paar GB (ohnehin nicht 50 GB).
Ich glaube, Sie können versuchen, die Aufteilung für Ihre Anforderung zu verwenden, und lassen Sie es uns wissen.
In 5 GB Dateien aufteilen
split --bytes = 5G Eingabedatei
Es wird in mehrere Dateien mit 5 GB aufgeteilt und als xaa, xab, xac usw. bezeichnet.
Verketten
cat x *> outfile
Auf diese Weise können Sie am anderen Ende als einzelne Datei verketten.
Wenn Sie selten installiert haben, hat es für mich sehr gut funktioniert:
Zu trennen
Zusammenbauen:
Leistungen:
quelle
split
&cat
sind absolut zuverlässig. Sie können dies zusätzlich inline komprimieren. Angenommen, Ihre Eingabedatei lautetdump.bson
:Und dann rekonstituieren Sie mit diesem:
Tipp, das funktioniert genauso gut mit
xz(dec)
anstelle vong(un)zip
quelle