Das diction
Paket enthält ein Tool namens style
:
Style
analysiert die Oberflächeneigenschaften des Schreibstils eines Dokuments. Es werden verschiedene Lesbarkeitsstufen, Wortlängen, Sätze und Absätze gedruckt. Es kann ferner Sätze mit bestimmten Merkmalen lokalisieren.
Wenn ich beispielsweise Ihren (in einer Datei gespeicherten flux_question
) Fragentext auswerte , um die Sätze mit einem Lesbarkeitsindex (ARI) über 10 auszudrucken:
$ style -r 10 flux_question
flux_question:1: Is there a command line program that takes a file containing English text, analyzes the text, and outputs its readability scores?
flux_question:2: For example, if one feeds the program a text, the program should output the Flesch-Kincaid grade level, McLaughlin's SMOG grading, etc.
readability grades:
Kincaid: 10.2
ARI: 10.8
Coleman-Liau: 12.5
Flesch Index: 51.1/100
Fog Index: 12.0
Lix: 48.6 = school year 9
SMOG-Grading: 11.2
sentence info:
333 characters
65 words, average length 5.12 characters = 1.65 syllables
4 sentences, average length 16.2 words
25% (1) short sentences (at most 11 words)
0% (0) long sentences (at least 26 words)
1 paragraphs, average length 4.0 sentences
25% (1) questions
25% (1) passive sentences
longest sent 21 wds at sent 2; shortest sent 8 wds at sent 4
word usage:
verb types:
to be (1) auxiliary (2)
types as % of total:
conjunctions 5% (3) pronouns 9% (6) prepositions 2% (1)
nominalizations 0% (0)
sentence beginnings:
pronoun (1) interrogative pronoun (0) article (0)
subordinating conjunction (0) conjunction (0) preposition (0)
Um die Ausgabe zu filtern, können Sie zB tail -n8
nur die Noten grep 'Flesch\|SMOG'
abrufen oder nur den Flesch-Index und die SMOG-Bewertung ausdrucken:
$ style style_test | grep 'Flesch\|SMOG'
Flesch Index: 51.7/100
SMOG-Grading: 11.2
Weitere Lektüre