Ich bräuchte ein Programm, das die Anzahl der verschiedenen Zeichen in einer Datei ausgibt. Beispiel:
> stats testfile
' ': 207
'e': 186
'n': 102
Gibt es ein Tool, das das macht?
command-line
files
text-processing
Mnementh
quelle
quelle
sed 's/\(.\)/\1\'$'\n/g' text.txt
sed
tun, aber die Python-Lösung von Jacob Vlijm hat für mich gut funktioniert.Stevens Lösung ist gut und einfach. Bei sehr großen Dateien (Dateien, die nicht in die Hälfte des Arbeitsspeichers passen) ist die Leistung aufgrund des Sortierschritts nicht so hoch. Hier ist eine awk-Version. Es ist auch ein wenig komplizierter , weil es versucht , das Richtige für ein paar Sonderzeichen (Zeilenumbrüche, zu tun
'
,\
,:
).Hier ist eine Perl-Lösung nach dem gleichen Prinzip. Perl hat den Vorteil, intern sortieren zu können. Dies wird auch eine zusätzliche Newline nicht korrekt zählen, wenn die Datei nicht mit einem Newline-Zeichen endet.
quelle
Eine langsame, aber relativ speicherfreundliche Version mit Ruby. Ungefähr ein Dutzend MB RAM, unabhängig von der Eingabegröße.
quelle