Meine Methode, um genaue Dupes zu finden, ist diese Befehlszeile unter Windows mit Cygwin oder Linux.
find /path/to/files/ -name "*.file-extension" -exec md5sum -b {} \; |sort|uniq -w 32 -c|sort -n
Am Ende der Liste wird der betrogene md5-Hash mit dem Pfad zur ersten Instanz der Datei angezeigt.
Sie finden alle Kopien dieser Datei mit:
find /path/to/files/ -name "*.file-extension" -exec md5sum -b {} \;| grep "MD5HASHCODEHERE"
Wobei MD5HASHCODEHERE der 32 Zeichen lange Code ist.
Ich habe dies einmal bei 650.000 Dateien gemacht, um alle Versionen derselben 8-GIF-Dateien zu finden, und es dauerte weniger als eine Stunde. Ich weiß nicht, ob in OSX standardmäßig md5sum installiert ist. Bei Bedarf kann ich eine OSX-Version anbieten.
Keine Ahnung, ob das hilfreich ist.
Das Teekesselchen-Add-On funktioniert auch gut.
quelle