Ich habe ein Problem. Ich muss so etwas wie 800 Datensätze extrahieren und es würde Tage dauern, um das manuell zu tun.
Die Informationen können durch Einfügen weniger Felder in das Formular (immer dasselbe) und dann einer Variablen in einem bestimmten Intervall erhalten werden. Die Seite übergibt keine Parameter im Klartext, daher kann ich nicht einfach ein sehr einfaches Tool verwenden, das die Parametervariable inkrementiert.
Gibt es ein gutes Tool, das mir dabei helfen könnte?
internet
web-crawler
Jarek
quelle
quelle
Antworten:
Wenn Sie keine Angst vor dem Programmieren haben, gibt es ein brillantes Sellenium-Framework. Kurz gesagt, Sie können einen Browser automatisieren und imitieren, indem Sie sein Verhalten auf einer Seite programmieren. http://code.google.com/p/selenium/?redir=1
quelle
Dobrý den,
Hey, es scheint, dass sie einige SOAP-Dienste haben. Wahrscheinlich könnten Sie die XML-RPC-Bibliothek von jeder Computersprache aus verwenden, um auf die Daten zuzugreifen. Ich fand diese wsdl https://katastr.cuzk.cz/static/wsdl/sestavy.wsdl, aber sie haben möglicherweise andere ...
quelle
Sehen Sie sich an, wie Sie ein Skript mit Perl Mechanize oder Ruby Mechanize schreiben. Vielleicht würde sogar AutoHotKey, ein Programm zum Erstellen von Makros, für Sie funktionieren.
quelle