Ich habe eine Reihe doppelter Nachrichten im Maildir meines IMAP-Servers. Was ist der beste Weg, um sie zu entfernen?
Einige relevante Punkte:
- Shared Message-ID ist normalerweise eine ausreichend gute Definition für Duplikate. Ein winziges Skript, das alle bis auf eine der doppelten Nachrichten entfernt, würde funktionieren.
- Manchmal ist es notwendig, Duplikate zu finden, die auf gemeinsam genutzten Nachrichtentexten basieren. Was ist eine vernünftige Definition von hier geteilt? Bitweises Äquivalent? Was ist mit seltsamen Unterschieden beim Zeilenumbruch, Escapezeichen und Zeichenkodieren?
- Manchmal gibt es einen bedeutenden Unterschied zwischen "doppelten" Nachrichten. Was ist der beste Weg, um die Unterschiede in Sätzen von "doppelten" Nachrichten zu überprüfen? Diffs?
Für generische Dateien unter Linux verwende ich fdupes-Utils, um doppelte Dateien zu entfernen. Ich fand, dass es auch für Maildir-Nachrichten funktioniert.
quelle
.forward
oder aus irgendeinem Grund zweimal zugestellt wird, hat leicht unterschiedliche Überschriften. Während die Nachricht selbst ein Duplikat ist, sind die beiden Dateien, die die beiden Kopien enthalten, möglicherweise nicht vorhanden.Gnome's Evolution [ein grafischer Mail-Benutzeragent] verfügt über eine integrierte Funktion zum Entfernen doppelter Mail. Wie auf dieser Hilfeseite erläutert , läuft es auf Folgendes hinaus:
Voilà.
PS Evolution kann lokal (MailDir, MH, Mbox) oder über IMAP auf Ihre Nachrichten zugreifen.
quelle
Das Beste, was ich heute gefunden habe, ist Kevin Deldyckes Maildir-Deduplikat .
X-MIMETrack
Header wird standardmäßig ignoriert und die Header mit dem verglichenSHA224
Digests .Ich wette, jemand könnte aus Rick Sanders ' delIMAPdups.pl , einem Teil seiner IMAP-Tools , etwas Besonderes machen .
quelle
maildir-deduplicate
ist an einen neuen Ort umgezogen, also habe ich den Link aktualisiert. Ihre Informationen sind jedoch nicht mehr aktuell.