Wget es una herramienta que nos premite descargar un sitio web al completo desde una simple línea de comandos de Linux.
Su usro sería así:
wget –random-wait –limit-rate=64k -e robots=off -r -p -U mozilla http://www.migueb.com
Donde…
–random-wait significa que entre un pedido y otro al website, que espere un tiempo aleatorio, para así no pedir demasiadas páginas y archivos uno detrás de otro y alarmar a algún sistema de seguridad.
–limit-rate=64k significa que no pase de 64 KiloBytes por segundo en transferencia de datos. Este número depende de tu conexión a Internet, y no es recomendado que lo incrementes mucho para no alarmar al website remoto. También puedes especificar el valor en MB/s sustituyendo la «k» por una «m».
-e robots=off significa que wget no debe prestar atención al archivo robots.txt que indica cuáles páginas no deben accederse por un navegador web.
-r significa que queremos todo de manera recursiva.
-p indice que descargue todos los archivos para desplegar adecuadamente una página HTML.
-U mozilla significa que impersonifique a la familia Mozilla de navegadores (como Firefox).
Y finalmente sustituye http://www.migueb.com por el website que deseas descargar.
Una herramienta muy útil y sencilla de usar!! 😉