Okay, ich gebe auf. Wie kann ich die Größe der heruntergeladenen Dateien begrenzen, z. B. wenn ich keine Dateien mit mehr als 2 MB möchte?
Die einzige mir bekannte Einschränkungsoption, die wget
unterstützt wird, ist der -Q
Kontingentwechsel. Dies ist jedoch nicht das, was Sie möchten, da es nach einer kombinierten Begrenzung aller heruntergeladenen Dateien und nicht einzeln beendet wird. -Q
Wie in der Manpage erläutert, funktioniert es auch nicht, jeden Link separat mit dem Switch zu verbinden .
Ich weiß nicht, welche Umgebung Sie verwenden, aber der Crawler unterstützt Dateigrößenbeschränkungen mit maximaler Länge und wird auf der Java-Plattform ausgeführt.
aus ihrem Benutzerhandbuch :
- Max-Länge-Bytes
Maximale Anzahl von Bytes zum Herunterladen pro Dokument. Schneidet die Datei ab, sobald dieses Limit erreicht ist.
Standardmäßig ist dieser Wert auf einen extrem großen Wert (im Exabyte-Bereich) eingestellt, der in der Praxis niemals erreicht wird.
Wenn es darum geht, " maximal 2 MB herunterzuladen " und nicht " Dateien mit maximal 2 MB herunterzuladen ", können Sie die auf der Festplatte gespeicherte Ausgabe einfach einschränken.
wget -O - $url |head -c 1024
(mit einem optionalen> $SaveAsFile
) -> speichert die erste KB und der Rest wird abgeschnitten.(genug, um eine " OK: $ Message " zu sehen, die mein / tmp nicht mit Tonnen von Fehlermeldungen von der Fernbedienung beendet ;-))
quelle
Dies ist mithilfe von Patches von Drittanbietern möglich: http://yurichev.com/wget.html
quelle