Als «web-scraping» getaggte Fragen

Beim Web-Scraping werden bestimmte Informationen von Websites extrahiert, die keine API oder andere Methoden zum automatisierten Abrufen von Daten bereitstellen. Fragen zu "Erste Schritte mit dem Scraping" (z. B. mit Excel VBA) sollten * gründlich recherchiert * werden, da zahlreiche Beispiele für Funktionscodes verfügbar sind. Web-Scraping-Methoden umfassen Anwendungen von Drittanbietern, die Entwicklung kundenspezifischer Software oder sogar die standardisierte manuelle Datenerfassung.

386
So finden Sie Elemente nach Klasse

Ich habe Probleme beim Analysieren von HTML-Elementen mit dem Attribut "class" mithilfe von Beautifulsoup. Der Code sieht so aus soup = BeautifulSoup(sdata) mydivs = soup.findAll('div') for div in mydivs: if (div["class"] == "stylelistrow"): print div Ich erhalte eine Fehlermeldung in derselben...

178
Web-Scraping-JavaScript-Seite mit Python

Ich versuche einen einfachen Web Scraper zu entwickeln. Ich möchte Text ohne den HTML-Code extrahieren. Tatsächlich erreiche ich dieses Ziel, aber ich habe gesehen, dass ich auf einigen Seiten, auf denen JavaScript geladen ist, keine guten Ergebnisse erzielt habe. Wenn beispielsweise ein...

72
Web Scraping mit Java

Ich kann keine gute Java-basierte Web-Scraping-API finden. Die Site, die ich kratzen muss, bietet auch keine API. Ich möchte mit einigen über alle Webseiten iterieren pageIDund die HTML-Titel / andere Dinge in ihren DOM-Bäumen extrahieren. Gibt es andere Möglichkeiten als Web Scraping?...

16
Wie kann ich schneller kratzen

Die Arbeit hier besteht darin, eine API einer Site zu kratzen, die von https://xxx.xxx.xxx/xxx/1.jsonbis beginnt , https://xxx.xxx.xxx/xxx/1417749.jsonund sie genau in mongodb zu schreiben. Dafür habe ich folgenden Code: client = pymongo.MongoClient("mongodb://127.0.0.1:27017") db =...