Kann jemand ein gutes Hilfsprogramm zur Erkennung von Fotokopien vorschlagen, das gut funktioniert, wenn ich mit etwa 100 GB Daten (die im Laufe der Jahre gesammelt wurden) zu tun habe?
Ich würde etwas vorziehen, das auf Ubuntu funktioniert.
Danke im Voraus!
Bearbeiten: Gibt es ein Tool, mit dem ich meine Sammlung neu organisieren und Duplikate entfernen kann, sobald sie erkannt wurden?
Edit2: Der schwierige Teil ist, herauszufinden, was zu tun ist, wenn die Ausgabe aus Tausenden doppelten Dateien besteht (z. B. die Ausgabe von fdupes).
Es ist nicht offensichtlich, ob ich ein Verzeichnis trotzdem sicher löschen kann (dh ob ein Verzeichnis eindeutige Dateien enthalten könnte), welche Verzeichnisse Teilmengen anderer Verzeichnisse sind und so weiter. Ein ideales Tool für dieses Problem sollte in der Lage sein, die Duplizierung von Dateien zu ermitteln und dann ein leistungsstarkes Mittel zur Umstrukturierung Ihrer Dateien und Ordner bereitzustellen. Eine Zusammenführung durch Hardlinking (wie dies bei fslint der Fall ist) setzt zwar Speicherplatz frei, löst jedoch nicht das zugrunde liegende Problem, das zu Beginn zu Duplikaten geführt hat - dh eine fehlerhafte Datei- / Verzeichnisorganisation.
quelle
Antworten:
ImageMagick zur Rettung. Ich denke, der erste Schritt zu einer Lösung besteht darin, die Größe Ihrer Sammlung zu reduzieren. Wenn Sie die Fotos nach ihrem Inhalt vergleichen möchten , insbesondere wenn es sich bei einigen um geringfügig geänderte Versionen handelt, empfiehlt es sich, sie auf Miniaturansichten zu reduzieren und dann die Miniaturansichten zu vergleichen. Dies ist besonders hilfreich, wenn Sie fast identische Fotos finden und unwichtige Unterschiede während des Vergleichs "ignorieren" möchten.
Mein Vorschlag ist auf einer hohen Ebene, dass Sie:
1- Verwenden Sie das Mogrify- Tool von ImageMagick , um die Fotos in Miniaturansichten zu verkleinern. Dies wird einige Zeit in Anspruch nehmen, aber die eigentlichen Vergleichsschritte werden dadurch viel schneller und genauer.
2- Verwenden Sie das Vergleichstool von ImageMagick , mit dem Sie einen Schwellenwert für den Vergleich festlegen können , dh, Sie können Fotos finden, die sich zu 85% ähneln. Sie sollten ein kontrolliertes Experiment durchführen, um den Schwellwert herauszufinden, der Ihnen am besten gefällt.
quelle
Der Open-Source- Fotobetrachter / -organisator Geeqie verfügt über eine leistungsstarke Funktion zum Suchen von Duplikaten . Es können verschiedene Strategien zum Auffinden von Duplikaten verwendet werden:
Es wird eine Ergebnisliste angezeigt, die Miniaturansichten enthalten kann, die Sie manuell bestätigen können.
Dies wird wahrscheinlich für Tausende von Dateien langsam sein, aber ich denke , mit ihm einfach und lassen Sie es für ein paar Tage laufen oder was auch immer insgesamt wahrscheinlich weniger Aufwand als zu finden oder etwas zu machen für den Fall zugeschnitten - es sei denn , Prüfsumme Spiel alles , was Sie brauchen.
quelle
Es gibt ein kleines Hilfsprogramm namens "fdupes" , das tun kann, was Sie wollen?
Es gibt auch ein anderes Dienstprogramm namens "fslint" , das Sie vielleicht auch ausprobieren möchten. (Dieser hat eine GUI).
quelle
fdupes
- es gibt eine Option zum Löschen der Dupes. askubuntu.com/a/476732dupeGuru Picture Edition ist ein anpassbarer Duplikat-Image-Finder für Windows, Mac OS X und Linux.
Es gibt einige Versionen von dupeGuru (Standard-, Musik- und Bildeditionen), und mit der Bildedition können Sie unter anderem über einen Bitmap-blockierenden Vergleichsalgorithmus visuell ähnliche Bilder finden (z. B. EXIF-Originalbildzeitstempel oder Dateien, die einfach identisch sind). .
Es verfügt über eine Reihe weiterer nützlicher Funktionen wie ausgeschlossene Ordner, Unterstützung für iPhoto / Aperture-Bibliotheken und eine umfassende Anpassung der Art und Weise, wie Duplikate erkannt und verarbeitet werden.
quelle
Was meinst du mit doppelten Fotos? Meinen Sie damit Dateien, die identisch sind, zum Beispiel ein oder zwei zusätzliche Male kopiert? oder meinst du fotos die "gleich aussehen".
Wenn Sie identische Dateien meinen, können Sie "shasum" für alle Dateien verwenden, dann die Ergebnisse sortieren und die eindeutigen Zeilen mit "uniq" suchen und ein "diff" ausführen, um zu sehen, was beseitigt wurde. Alles einfach in einer Ubuntu-Shell.
quelle
Es gibt eine Anwendung namens "Bleachbit", die doppelte Dateien nach Größe, Namen und anderen Filtern findet. Sie können es über den Synapctic Package Manager in Ubuntu installieren.
quelle