Ich habe ungefähr 2000 MP3-Dateien geerbt. Für die meisten von ihnen werden ihre ID3-Tags in Amarok verstümmelt angezeigt . Ich benötige eine Software, die die ID3-Tags auf den Typ v2.4 aktualisiert $03
(dh UTF-8-Codierung), alle v1-Tags entfernt und auch klug ist, die ursprüngliche Codierung von Fall zu Fall herauszufinden (höchstwahrscheinlich eine davon) Windows-1252, UTF-16 ohne Stückliste oder GB18030).
Gibt es bereits eine so vollständige Lösung, die ich verwenden könnte, bevor ich dies selbst auf TagLib programmiere?
Empfehlen Sie Musicbrainz nicht weiter - es ist stark voreingenommen gegenüber in den USA veröffentlichter Musik und für mich nahezu nutzlos. Empfehlen Sie keine allgemeine ID3-Tagging-Software, ohne sie zuerst anhand meiner Anforderungen zu testen - die meisten davon
- unterstütze v2.4 nicht
- habe, ehrlich gesagt, leise verzögerte Vorstellungen über die Zeichenkodierung
- haben keine Automatisierungsfunktionen (ich möchte meine Zeit nicht manuell bearbeiten).
Ich bin auch (noch) nicht nur an Tag-Bereinigungs-, Massenumbenennungs- oder Kategorisierungssoftware interessiert. Ich habe zuerst den oben erwähnten Normalisierungsschritt durchgeführt.
mid3v2
ist nur die halbe Lösung. Nachdem ich es ausprobiert habe, ist es definitiv nicht gut mit den falsch identifizierten Codierungen, unter denen ich leide, dh ein aktualisiertes ID3-Tag wird in Amarok immer noch falsch angezeigt. Mutagen scheitert an meiner Forderung nach »klug, die ursprüngliche Kodierung herauszufinden«; es geht freudig vonLatin1
/ ausWindows-1252
, was standardkonform ist, aber für die unordentliche reale Welt nutzlos. Ich bin geneigt, diese Antwort jetzt nicht zu akzeptieren; Ich werde noch ein paar Tage Gelegenheit für andere Antworten geben. Wenn nichts Gutes kommt, werden Sie akzeptiert.mid3v2
ist, der nicht zu hell ist, und das überrascht mich nicht ... aber ich denke, Python hat einige Zeichencodierungsmodule (vielleichticonv
oder ähnlich), die intelligenter sind und für Heimwerker nützlich sein könnten. äh.Ich glaube nicht, dass Sie eine eigenständige Anwendung finden werden, die Ihre spezielle Auswahl an falsch gekennzeichneten Codierungen korrigiert. Eine Mischung aus cp1252, UTF-16 und GB-18030 zu haben, ist ziemlich ungewöhnlich und ich glaube nicht, dass vorhandene Software dies automatisch lösen kann.
Also würde ich Mutagen herunterladen und ein benutzerdefiniertes Python-Skript schreiben, um Ihre eigenen Entscheidungen darüber zu automatisieren, wie unbekannte Codierungen repariert werden sollen. Zum Beispiel:
Das obige Skript macht einige Annahmen:
Nur die Tags, die als in Codierung 0 markiert sind, sind falsch. (Angeblich ist die Codierung von 0 ISO-8859-1, in der Praxis handelt es sich jedoch häufig um eine Windows-Standardcodepage.)
Wenn ein Tag als UTF-8- oder UTF-16-Codierung markiert ist, wird es als korrekt angenommen und einfach in UTF-8 konvertiert, sofern dies noch nicht geschehen ist. Persönlich habe ich noch keine fehlerhaften ID3s gesehen, die als UTF (Codierungen 1-3) markiert waren. Glücklicherweise kann die Codierung von 0 leicht in ihre ursprünglichen Bytes wiederhergestellt werden, da ISO-8859-1 eine direkte 1: 1-Zuordnung der ordinalen Bytewerte ist.
Wenn ein Tag mit der Codierung 0 erfüllt ist, versucht das Skript, es zuerst als GB18030 neu zu formulieren. Wenn es nicht gültig ist, wird auf Codepage 1252 zurückgegriffen. Einzelbyte-Codierungen wie cp1252 stimmen in der Regel mit den meisten Byte-Sequenzen überein am Ende der Liste der zu versuchenden Codierungen.
Wenn Sie andere Codierungen wie cp1251 Cyrillic oder viele cp1252-Dateinamen mit mehreren Zeichen mit Akzent hintereinander haben, die mit GB18030 verwechselt werden, benötigen Sie einen cleveren Schätzalgorithmus. Schauen Sie sich vielleicht den Dateinamen an, um zu erraten, welche Art von Zeichen wahrscheinlich vorhanden sind.
quelle
Wie wäre es mit Mp3Tag mit Wein ?
Eigenschaften (unter anderem):
quelle
Foobar bietet eine ziemlich vollständige Tagging-Unterstützung . Es läuft unter Wein.
quelle
Es gibt auch EasyTag
Vielleicht möchten Sie auch wissen, dass id3v2.3 normalerweise das bevorzugte Format ist, da Windows Media Player 2.4 nicht unterstützt
quelle