Entfernen Sie doppelte Nachrichten aus Maildir

10

Ich habe eine Reihe doppelter Nachrichten im Maildir meines IMAP-Servers. Was ist der beste Weg, um sie zu entfernen?

Einige relevante Punkte:

  • Shared Message-ID ist normalerweise eine ausreichend gute Definition für Duplikate. Ein winziges Skript, das alle bis auf eine der doppelten Nachrichten entfernt, würde funktionieren.
  • Manchmal ist es notwendig, Duplikate zu finden, die auf gemeinsam genutzten Nachrichtentexten basieren. Was ist eine vernünftige Definition von hier geteilt? Bitweises Äquivalent? Was ist mit seltsamen Unterschieden beim Zeilenumbruch, Escapezeichen und Zeichenkodieren?
  • Manchmal gibt es einen bedeutenden Unterschied zwischen "doppelten" Nachrichten. Was ist der beste Weg, um die Unterschiede in Sätzen von "doppelten" Nachrichten zu überprüfen? Diffs?
Joseph Holsten
quelle

Antworten:

3

Für generische Dateien unter Linux verwende ich fdupes-Utils, um doppelte Dateien zu entfernen. Ich fand, dass es auch für Maildir-Nachrichten funktioniert.

Sarabande
quelle
1
fdupes scheint nur für exakte Duplikate zu funktionieren, während das OP (implizit) nach komplexeren Duplikationsmustern fragt. Eine Nachricht, die aufgrund .forwardoder aus irgendeinem Grund zweimal zugestellt wird, hat leicht unterschiedliche Überschriften. Während die Nachricht selbst ein Duplikat ist, sind die beiden Dateien, die die beiden Kopien enthalten, möglicherweise nicht vorhanden.
Tripleee
0

Gnome's Evolution [ein grafischer Mail-Benutzeragent] verfügt über eine integrierte Funktion zum Entfernen doppelter Mail. Wie auf dieser Hilfeseite erläutert , läuft es auf Folgendes hinaus:

  1. Wählen Sie die verdächtigen Nachrichten (oder nur alle Nachrichten) aus.
  2. Gehen Sie zum Menü Nachrichten und wählen Sie Doppelte Nachrichten entfernen .

Voilà.

PS Evolution kann lokal (MailDir, MH, Mbox) oder über IMAP auf Ihre Nachrichten zugreifen.

Franklin Piat
quelle
0

Das Beste, was ich heute gefunden habe, ist Kevin Deldyckes Maildir-Deduplikat .

  • Der X-MIMETrackHeader wird standardmäßig ignoriert und die Header mit dem verglichenSHA224 Digests .
  • Duplikate werden automatisch gelöscht, ohne dass eine Bestätigung angefordert wird. Es gibt jedoch einen Trockenlaufmodus, in dem in der Vorschau angezeigt wird, welche Duplikate gelöscht werden.

Ich wette, jemand könnte aus Rick Sanders ' delIMAPdups.pl , einem Teil seiner IMAP-Tools , etwas Besonderes machen .

Joseph Holsten
quelle
maildir-deduplicate ist an einen neuen Ort umgezogen, also habe ich den Link aktualisiert. Ihre Informationen sind jedoch nicht mehr aktuell.
Adam Spiers
Ich habe dies aktualisiert, damit es keine irreführenden veralteten Informationen mehr gibt.
Adam Spiers