Wie kann ich doppelte Songs finden?

31

Der Titel sagt schon alles. Wie kann ich Duplikate in meiner Medienbibliothek erkennen?

Ingo
quelle

Antworten:

24

Die dupeGuru Music Edition ist genau das, was Sie wollen. Stellen Sie den Scan-Typ in den Einstellungen auf "Audio-Inhalte" ein. Bitte beachten Sie, dass das Programm Fairware ist, also tragen Sie bitte bei, wenn Sie können.

Alt-Text

Ich schlage vor, Sie koppeln dies mit MusicBrainz Picard, das Ihre Musikdateien automatisch markieren kann.

Alt-Text

Li Lo
quelle
PERFEKT! Endlich eine Antwort, die wie ein Zauber wirkte :). Ein Banshee-Plugin oder was auch immer wäre noch besser gewesen, aber das funktioniert großartig! Ich habe tatsächlich ungefähr 8 GB Dupes entfernt, Prost!
Ingo
2
Schade, dass dupeGuru immer nur 10 Removals gleichzeitig ausführen kann, ohne Geld einzulegen.
John McKean Pruitt
Das PPA ist für die neuesten Ubuntu-Versionen nicht mehr verfügbar. Ich hatte Erfolg bei der Installation von .deb direkt von launchpad.net/~hsoft/+archive/ubuntu/ppa/+build/9735351 und beim anschließenden Ausführen dupeguru_me.
rjh
In der neuesten Version sind die Entfernungen unbegrenzt. Es scheint jedoch keinen Fingerabdruck der Musik zu hinterlassen, sondern vergleicht lediglich Dateinamen / ID3-Informationen. Wenn Sie ein Tool wie Picard verwenden, um Ihre Musik zuerst zu markieren, sollte dies einen guten Job machen :)
rjh
10

Es gibt ein Plugin, das vor einiger Zeit dafür gemacht wurde. Ich habe es vor kurzem benutzt, aber es lässt immer noch zu wünschen übrig. Es gibt ein " PPA " dafür - aber noch keine gebauten Pakete, nur die Bazaar-Filiale. Die Installationsanweisungen sehen ungefähr so ​​aus:

wget http://scrawl.bplaced.net/duplicate-source.tar.gz -O tmp.tar.gz && mkdir -vp ~/.gnome2/rhythmbox/plugins/duplicate-source/ && tar -xf tmp.tar.gz -C ~/.gnome2/rhythmbox/plugins && rm -v tmp.tar.gz

Wenn Sie den Bazaar'd-Quellcode verwenden möchten, gehen Sie stattdessen wie folgt vor:

mkdir -vp ~/.gnome2/rhythmbox/plugins && cd ~/.gnome2/rhythmbox/plugins && bzr branch lp:rb-duplicate-source duplicate-source

Sobald es installiert ist, starte Rhythmbox neu und du solltest einen Duplicates Finder in der Plugin-Liste haben.

Plugins-Liste

Nach der Aktivierung stehen zusätzliche Konfigurationsoptionen zur Verfügung.

Konfigurationsfenster

Nachdem das Plugin aktiviert wurde und Duplikate gefunden wurden, fügt es Ihrer Bibliotheksliste eine zusätzliche Option hinzu:

Liste

Einige Einstellungen, die ich als "ungerade" gefunden habe - Ich habe dies in einer Medienbibliothek mit über 120.000 Songs (über 1.000 Duplikate) und einer Bibliothek mit etwa 1.000 Songs und möglicherweise 30 Duplikaten versucht. Bei ersteren hat es SEHR lange gedauert und die Rhythmbox stürzte während der Suche mehrmals ab. Ich habe mich schließlich für "Automatisch aus Bibliothek entfernen" entschieden, um zu vermeiden, dass die Liste neu erstellt werden muss. Auf kleineren Bibliotheken funktioniert jedoch alles sehr gut.

Wenn ein Duplikat gefunden wird - wenn Sie die Standardoptionen ausgewählt haben - wird die Version des Songs mit niedrigerer Qualität zur Liste hinzugefügt. So ist es sicher, alle Songs in der Liste der Duplikate auszuwählen und "Entfernen" (entweder von der Festplatte löschen oder aus der Bibliothek entfernen).

Marco Ceppi
quelle
Vielen Dank für diesen Tipp! Sobald ich es aktiviert habe, scheint jedoch nichts mehr zu passieren. Ich kann keinen neuen Tab finden oder was auch immer, wo die Duplikate angezeigt würden.
Ingo
Möglicherweise müssen Sie den Schwellenwert auf 0,5 verschieben, um Duplikate auszusortieren. Es wird als zusätzliches Element in Ihrer Bibliotheksliste angezeigt. Ich habe die Antwort aktualisiert, um dies zu zeigen.
Marco Ceppi
Versuchte das auch. Kein Erfolg.
Ingo
5

Sie können dafür fdupes verwenden :

$ fdupes -r ~/Music

Dadurch erhalten Sie eine Liste aller doppelten Dateien.

Sie können es einfach mit installieren

sudo apt-get install fdupes
Johann
quelle
4
Dies funktionierte besser als die anderen Optionen. Es scheint jedoch nicht wirklich für Audiodateien geeignet zu sein. Die Software vergleicht keine Tags usw., was zu einer sehr kurzen Liste von Dateien führt, obwohl es in Wirklichkeit viele viele Duplikate gibt, möglicherweise jedoch nicht mit genau der gleichen Dateigröße (da diese möglicherweise aus verschiedenen Quellen stammen).
Ingo
3

Ich bin auf ein ähnliches Problem gestoßen, als ich mehrere doppelte Bilddateien hatte. In meinem Fall habe ich nur md5sumdie Dateien verwendet und die Ergebnisse sortiert:

for file in $(find $rootdir -name "*.jpg"); do echo $(md5sum $file); done | sort

Dateien mit demselben Inhalt erzeugten denselben Hash, sodass Duplikate leicht gefunden werden konnten. Ich habe die Dupes von dort manuell gelöscht, obwohl ich das Skript so erweitern könnte, dass alle bis auf das erste Vorkommen gelöscht werden, aber ich bin immer paranoid, wenn ich das in einem Ad-hoc-Skript mache.

Beachten Sie, dass dies nur für doppelte Dateien mit identischem Inhalt funktioniert .

John Bode
quelle
Schneller:find $rootdir -name '*.jpg' -exec md5sum {} + | sort
Robert Vila
1

Probieren Sie FSlint oder Dupe Gredtter

Um FSlint zu installieren, geben Sie Folgendes in das Terminal ein (Strg-Alt-T)

sudo apt-get install fslint

hoffe das ist nützlich ..

FOSS DIVERSER
quelle
-2

Ich habe FSlint verwendet , um im Allgemeinen doppelte Dateien zu finden. FSlint ist "ein Dienstprogramm zum Auffinden und Reinigen verschiedener Arten von Flusen in einem Dateisystem."

Aputsiak
quelle
Das ist komisch. FSlint findet keine meiner doppelten Songs!
Ingo
Mit den Standardeinstellungen von FSlint werden möglicherweise doppelte Dateien anhand des Dateinamens und der Dateigröße gefunden, aber keine doppelten Titel, wenn es sich um unterschiedliche Aufzeichnungen mit unterschiedlicher Größe und unterschiedlichem Dateinamen handelt.
Aputsiak,
Unterschiedliche Aufnahmen (Remixe?) Können nicht sicher gelöscht werden. Sie können eigenen Wert haben.
Extender
Ich habe auch fslint für Audio verwendet (mit einigermaßen Erfolg) - obwohl ich einige der Alternativen in diesem Thread gegeben habe, werde ich beim nächsten Mal wahrscheinlich eine davon ausprobieren.
Belacqua