Alle Dateien mit bestimmter Endung einer Website runterladen

Hat man eine Seite, auf der z.B. eine Reihe MP3s verlinkt sind, kann man mit folgendem Befehl alle runterladen:

wget -O - 'http://www.somwhere.de/blabla.php' | grep -o -E 'http://[^"]*.(mp3)' | wget -i -

Der geht allerdings nur, wenn die Verlinkungen absolut (d.h. nicht relativ) sind.

Wie ich gerade merke, erfüllt diese Zeile aber das gleiche (und sollte zudem auch bei relativen Verlinkungen funktionieren):

wget --span-hosts -r -l1 --no-parent -erobots=off -A.mp3 'http://www.somwhere.de/blabla.php'

Wichtig ist hierbei das –span-host, welches auch das Herunterladen von anderen Domains als www.somewhere.de erlaubt.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert