Website Wordcount mit WGET

1

Ich würde gerne wissen, ob es möglich ist, mit wget eine ganze Website zu zählen.

Hat das schon jemand ausprobiert?

Folgendes habe ich bisher gefunden:

wget -q -O- http://www.website.com | grep -c .
mnml
quelle
Du meinst die tatsächliche Wortzahl? Oder möchten Sie auch die Meta-Wörter wie Tags, Attribute, Titel usw. zählen?
M'vy
ja nur der inhalt
mnml
Dann benötigen Sie einen HTML-Parser, der Eingaben von stdin verarbeiten kann. Kenne keinen Geldautomaten.
M'vy

Antworten:

1

wget -q -r -O- http://www.example.com | wc -l

Wenn die Site jedoch nicht statisch ist, kennwortgeschützte Bereiche aufweist oder Formulare enthält, können Sie nicht alle problemlos abrufen.

Wenn Sie alle Wörter zählen müssen, sagen Sie Amazon, müssen Sie möglicherweise die Kreditkarte aufladen, die Ihrem Ein-Klick-Konto zugeordnet ist :-)

RedGrittyBrick
quelle