Tool zur Messung der Lesbarkeit von englischen Texten

13

Gibt es ein Befehlszeilenprogramm, das eine Datei mit englischem Text aufnimmt, den Text analysiert und seine Lesbarkeitswerte ausgibt?

Wenn man dem Programm beispielsweise einen Text zuführt, sollte das Programm die Flesch-Kincaid-Einstufung, McLaughlins SMOG-Einstufung usw. ausgeben.

Ich glaube, ein solches Programm existiert in den offiziellen Repositories, aber ich kann mich nicht an den Namen erinnern. Es besteht auch die Möglichkeit, dass ich mich falsch erinnere.

Fluss
quelle

Antworten:

11

Das diction Installieren Sie DiktionPaket enthält ein Tool namens style:

Style analysiert die Oberflächeneigenschaften des Schreibstils eines Dokuments. Es werden verschiedene Lesbarkeitsstufen, Wortlängen, Sätze und Absätze gedruckt. Es kann ferner Sätze mit bestimmten Merkmalen lokalisieren.

Wenn ich beispielsweise Ihren (in einer Datei gespeicherten flux_question) Fragentext auswerte , um die Sätze mit einem Lesbarkeitsindex (ARI) über 10 auszudrucken:

$ style -r 10 flux_question
flux_question:1: Is there a command line program that takes a file containing English text, analyzes the text, and outputs its readability scores?
flux_question:2: For example, if one feeds the program a text, the program should output the Flesch-Kincaid grade level, McLaughlin's SMOG grading, etc.
readability grades:
        Kincaid: 10.2
        ARI: 10.8
        Coleman-Liau: 12.5
        Flesch Index: 51.1/100
        Fog Index: 12.0
        Lix: 48.6 = school year 9
        SMOG-Grading: 11.2
sentence info:
        333 characters
        65 words, average length 5.12 characters = 1.65 syllables
        4 sentences, average length 16.2 words
        25% (1) short sentences (at most 11 words)
        0% (0) long sentences (at least 26 words)
        1 paragraphs, average length 4.0 sentences
        25% (1) questions
        25% (1) passive sentences
        longest sent 21 wds at sent 2; shortest sent 8 wds at sent 4
word usage:
        verb types:
        to be (1) auxiliary (2) 
        types as % of total:
        conjunctions 5% (3) pronouns 9% (6) prepositions 2% (1)
        nominalizations 0% (0)
sentence beginnings:
        pronoun (1) interrogative pronoun (0) article (0)
        subordinating conjunction (0) conjunction (0) preposition (0)

Um die Ausgabe zu filtern, können Sie zB tail -n8nur die Noten grep 'Flesch\|SMOG'abrufen oder nur den Flesch-Index und die SMOG-Bewertung ausdrucken:

$ style style_test | grep 'Flesch\|SMOG'
        Flesch Index: 51.7/100
        SMOG-Grading: 11.2

Weitere Lektüre

Dessert
quelle