Mein Verständnis: Wenn ein Webbrowser eine Anfrage zum Anzeigen einer Seite stellt, antwortet der Server mit dem HTML-Code. Anschließend rendert der Webbrowser diesen HTML-Code und sendet Anforderungen für jedes eingebettete Objekt (z. B. Bilder), das im HTML angezeigt wird, in weniger als einer Sekunde (Geben oder Nehmen) an den Server. Mit einem Web Scrapper fordere ich jedoch den Server auf, nur den HTML-Code zu erfassen und den HTML-Code überhaupt nicht zu rendern.
Gemäß der richtigen Etikette für Web Scrapping sollten Sie Ihre Anforderungen auf maximal eine pro Sekunde beschränken, um den Server nicht zu überlasten.
Warum ist es also kein Problem, wenn der Webbrowser eine Anfrage für jedes eingebettete Objekt sendet (mehrere Anfragen pro Sekunde), aber ein Web Scrapper mehrere Anfragen pro Sekunde sendet, nur für die HTML-Quelle für verschiedene Seiten?