¿Te pasado alguna vez qué quieres hacer un backup de una página web al que el cliente o tu mismo perdió los accesos y no hay forma de hacer una copia de respaldo? Bueno hay miles de situaciones que por cosas del destino nos hacen buscar la manera de preservar la información.
Imaginemos la siguiente situación: Un familiar que falleció recientemente tenía un Blog con WordPress y nadie más tenía acceso a su blog. El mismo está lleno de publicaciones memorables que a la familia le gustaría archivar.
Hay varias opciones cuando se trata de hacer una copia de seguridad de WordPress. Dependiendo del tipo de acceso que se tenga, recuperar la base de datos o una copia de seguridad XML es fácil. Pero, ¿qué pasa si no tienes acceso a la base de datos o al back-end?
Haz un backup de una página web con WGET
Una opción es usar WGET. WGET es un paquete de software libre y de código abierto utilizado para recuperar archivos mediante HTTP, HTTPS y FTP, los protocolos de Internet más utilizados.
Usé la versión 1.10.2 de este paquete WGET creado por HHerold que funcionó correctamente en mi Windows 7 de 64 bits. Una vez instalado, deberás acceder al símbolo del sistema y navegar a la carpeta donde está instalado WGET.exe.
En el ejemplo a continuación, utilicé cuatro parámetros diferentes. GNU.org tiene una excelente guía disponible que explica lo que hace cada parámetro. Alternativamente, puede usar el comando wget-help para ver una lista de comandos.
- HTML Extension: guardará los archivos recuperados como .HTML
- Convert Links: una vez completada la descarga, convertirá los enlaces en el documento para que sean adecuados para la visualización local. Esto afecta no solo a los hipervínculos visibles, sino a cualquier parte del documento que se vincule con contenido externo, como imágenes incrustadas, enlaces a hojas de estilo, hipervínculos a contenido no HTML , etc.
- -m Esto activa las opciones adecuadas para la duplicación.
- -w 10 Este comando pone 10 segundos entre cada archivo recuperado para que no interfiera con el tráfico del servidor.
Por ejemplo:
wget -html-extension -convert-links -m -w 10 https://ejemplo.com
Usando este comando, cada publicación y página se guardará como un archivo HTML. El sitio se copiará y los enlaces se convertirán para que pueda buscarlos localmente. El último parámetro coloca intervalos de 10 segundos entre cada archivo recuperado para ayudar a evitar la sobrecarga del servidor web.
Otras alternativas para hacer backups de página webs sin acceso
Desde hace muchos años, he utilizado el conocido WinHTTrack para realizar backup de páginas webs. Pero conforme la tecnología web ha ido avanzando poco a poco se hace más difícil recuperar una copia completa de un sitio web sin que falten imágenes o archivos.
WinHTTrack es confuso y difícil de usar, no es para cualquier usuario. A pesar de ello algunos javascripts no los logra recuperar completamente y muchas veces se deja una que otra imagen por fuera sobre todo si el sitio utiliza muchas de las nuevas propiedades de css3.
Con WGET, es completamente posible hacer un backup de una página web sitio a la que no tienes acceso, mas fácil que con cualquier otra herramienta conocida.