Posts Tagged ‘web downloadre linux’

h1

Wget: Descarga una web completa a nuestro disco duro desde Linux

5 marzo 2009

Wget es una herramienta que nos premite descargar un sitio web al completo desde una simple línea de comandos de Linux.

Su usro sería así:

wget –random-wait –limit-rate=64k -e robots=off -r -p -U mozilla http://www.migueb.com

Donde…

–random-wait significa que entre un pedido y otro al website, que espere un tiempo aleatorio, para así no pedir demasiadas páginas y archivos uno detrás de otro y alarmar a algún sistema de seguridad.

–limit-rate=64k significa que no pase de 64 KiloBytes por segundo en transferencia de datos. Este número depende de tu conexión a Internet, y no es recomendado que lo incrementes mucho para no alarmar al website remoto. También puedes especificar el valor en MB/s sustituyendo la «k» por una «m».

-e robots=off significa que wget no debe prestar atención al archivo robots.txt que indica cuáles páginas no deben accederse por un navegador web.

-r significa que queremos todo de manera recursiva.

-p indice que descargue todos los archivos para desplegar adecuadamente una página HTML.

-U mozilla significa que impersonifique a la familia Mozilla de navegadores (como Firefox).

Y finalmente sustituye http://www.migueb.com por el website que deseas descargar.

Una herramienta muy útil y sencilla de usar!! 😉