Entferne die gleichen * .tar.gz Archive

0

Ich habe crontab Ereignisarchive zu .tar.gz irgendeinem Ordner alle N Stunden. Endlich habe ich eine Sammlung von .tar.gz- Dateien. Jetzt möchte ich duplizierende Archive entfernen (erstellt, während die Zieldateien unverändert bleiben). Wie kann ich das tun?

Ich habe versucht, einen Vergleich durchzuführen, indem ich Hashsum überprüft habe, aber tar.gz-Archive haben immer eine andere Summe:

altera@nuclight:~$ rm -rf *
altera@nuclight:~$ echo "Hello world" > file
altera@nuclight:~$ tar czf a1.tgz file
altera@nuclight:~$ tar czf a2.tgz file
altera@nuclight:~$ tar czf a3.tgz file
altera@nuclight:~$ tar czf a4.tgz file
altera@nuclight:~$ tar czf a5.tgz file
altera@nuclight:~$ ls
a1.tgz  a2.tgz  a3.tgz  a4.tgz  a5.tgz  file
altera@nuclight:~$ md5sum *.tgz
e8587f4c381856af9278a6ef2a452b00  a1.tgz
2f44617fb164e66a74c5c4992637e7d4  a2.tgz
1a094b315e2d0891a0c5dafebae9718f  a3.tgz
6c3642d2441397c24e4de5377b9e0a7e  a4.tgz
7c0e9128ef47a9dbcda0dd008e34cd8d  a5.tgz
altera@nuclight:~$
atomAltera
quelle

Antworten:

0

Wenn Ihre Quelldateien vollständig unberührt bleiben, sollte das Ausführen eines Hashs / ​​einer Prüfsumme in Ihren Archiven für unveränderte Dateien zu denselben Ergebnissen führen. Dann löschen Sie einfach Dateien mit doppelten Hashes.

Mxx
quelle
Bereits ausprobiert, nachbearbeitet
AtomAltera
Wenn sich der MD5-Hash ändert, ist der Inhalt der Dateien nicht identisch. Sie müssen also möglicherweise herausfinden, was sich in den Archiven ändert.
Davidgo
1
Vielleicht versuchen Sie es mit der --atime-preserveOption tar?
Mxx