Ich habe eine Wortliste, die Benutzername, Telefonnummer und E-Mail enthält. Es stammt aus verschiedenen Quellen und ist daher in verschiedenen Größen erhältlich. Ich muss den doppelten Benutzernamen und alle Dinge in einer Reihe filtern.
Bisher habe ich die Methode mit Notepad ++ verwendet. Die Einschränkungen sind jedoch, dass nur jeweils eine Datei ausgefüllt wird. Und es kann keine Dateien wie 500 MB verarbeiten.
Wenn eine Datei den [email protected] hat, bedeutet dies, dass derselbe nicht in einer anderen Datei erscheinen sollte.
In einfacher Weise muss ich das obige Ergebnis mit Notepad ++ für mehrere Dateien erzielen, die HÖHER als 500 MB sind.
Irgendwelche Tools oder Programme? Oder ein effizientes Java- oder C # -Snippet?
Antworten:
Hier ist ein C # -Programm, das das tut, was Sie gefragt haben. Ich bin mir nicht 100% sicher, was Sie wollen.
Verwendung ist:
program.exe "outputfolder" "file1.txt" "file2.txt" "file3.txt"
Die aufgelisteten Dateien im Ausgabeordner werden in der angegebenen Reihenfolge neu geschrieben. Wenn in einer Zeile oder Datei zuvor ein Benutzername gefunden wurde, wird die Zeile übersprungen. Es werden weder E-Mails noch Telefonnummern überprüft.
quelle