Entfernen Sie doppelte MP3-Dateien mit unterschiedlichen Namen, Größen und Hashs

9

Ich habe eine riesige Musikbibliothek (alle MP3), aber ich habe einen Teil der Musik fast gleich, aber:

  1. Vielleicht ein oder zwei Sekunden länger
  2. Etwa 97% das gleiche wie bei einem anderen Lied
  3. Oder eine andere Bitrate.

Gibt es eine Möglichkeit, diese Duplikate zu finden? Wie bereits erwähnt, haben sie nicht die gleiche Größe, den gleichen Namen oder den gleichen SHA1-Hash.

Hans Groeffen
quelle

Antworten:

3

Es gibt ein Open-Source-System für akustische Fingerabdrücke namens Echoprint . Vielleicht möchten Sie überprüfen, ob ich eine große Sammlung deduplizieren möchte . Ich habe es noch nie benutzt (bin nur darüber gestolpert), aber es klingt großartig, dies lokal tun zu können.

Adrian Frühwirth
quelle
Unabhängig davon gibt es auch Deduplizierungswerkzeuge, die auf Tags basieren , wenn Ihre Dateien ordnungsgemäß mit Tags versehen sind (ich bin nicht sicher, ob Sie mit Namen Dateinamen und / oder ID3-Tags meinen).
Adrian Frühwirth
6

Verwenden Sie den Picard von MusicBrainz . Es scannt die Musik, um einen "Fingerabdruck" zu generieren, und vergleicht sie dann mit einer Online-Datenbank, um sie zu identifizieren (wobei alle Informationen wie Künstler, Album usw. abgerufen werden).

Nachdem die Songs identifiziert wurden, können sie in einer benutzerdefinierten Verzeichnis- und Namensstruktur organisiert werden, und Sie können diese verwenden, um die Duplikate zu finden.

Voll kompatibel mit Linux.

Patrick
quelle
Dies ist der definitive Weg, funktioniert großartig.
slm
Ok, ich glaube ich habe ein Problem. Keine meiner Musik ist kommerziell. Das meiste davon ist CC-lizenziert und von Jamendo heruntergeladen. Es heißt, es kann keine Übereinstimmungen finden.
Hans Groeffen
@ HansGroeffen dann wäre das ein Problem. Sie dürfen Fingerabdrücke bisher unbekannter Musik veröffentlichen, damit Sie dies tun können. Sie sollten sich jedoch bemühen, die Richtigkeit der Übermittlung zu überprüfen. Da Sie nicht übereinstimmende Namen haben, ist dies möglicherweise keine gute Idee. Ich bin mir nicht sicher, ob es eine Möglichkeit gibt, es nur für seine Fingerabdruck- und Vergleichsfunktionen zu verwenden.
Patrick
2
Die von Picard verwendete MusicBrainz-Datenbank kann vom Benutzer bearbeitet werden. Sie können neue Einträge für Künstler, Werke (Songs) und Veröffentlichungen (Alben / EPs) erstellen und dann mit Picard die Dateien neu markieren / verschieben. Es ist ein bisschen Mühe, aber es funktioniert - und es ist hilfreich für andere.
naught101
3

Ich würde empfehlen, beetsmit seinem duplicatesPlugin zu verwenden; beetsähnelt picardin Bezug auf die Funktionalität (es kann ID3-Informationen aus der musicbrainz-Datenbank abrufen und Ihre Dateien basierend auf diesen Informationen organisieren), geht jedoch mit einigen seiner Plugins über die Fähigkeiten von picard hinaus.

Persönlich benutze ich sie zusammen - picard zum Bereinigen von ID3-Tags und Rüben zum Organisieren der Dateien und zum Bereinigen von Duplikaten.

STW
quelle