Cómo hacer un backup de una página web si no tienes acceso

86

¿Te pasado alguna vez que quieres hacer un backup de una página web al que el cliente o tu mismo perdió los accesos y no hay forma de hacer una copia de respaldo? Bueno hay miles de situaciones que por cosas del destino nos hacen buscar la manera de preservar la información.

Imaginemos la siguiente situación: Un familiar que falleció recientemente tenía un Blog con WordPress y nadie mas tenía acceso a su blog. El mismo está lleno de publicaciones memorables que a la familia le gustaría archivar.

Hay varias opciones cuando se trata de hacer una copia de seguridad de WordPress. Dependiendo del tipo de acceso que se tenga, recuperar la base de datos o una copia de seguridad XML es fácil. Pero, ¿qué pasa si no tienes acceso a la base de datos o al back-end?

Haz un backup de una página web con WGET

Una opción es usar WGETWGET es un paquete de software libre y de código abierto utilizado para recuperar archivos mediante HTTP, HTTPS y FTP, los protocolos de Internet más utilizados.

Usé la versión 1.10.2 de este paquete WGET creado por HHerold que funcionó correctamente en mi Windows 7 de 64 bits. Una vez instalado, deberás acceder al símbolo del sistema y navegar a la carpeta donde está instalado WGET.exe.

Haciendo backup de una página web WGET en Windows 7
Así se ve WGET en acción.

En el ejemplo a continuación, utilicé cuatro parámetros diferentes. GNU.org tiene una excelente guía disponible que explica lo que hace cada parámetro. Alternativamente, puede usar el comando wget-help para ver una lista de comandos.

  • HTML Extension: guardará los archivos recuperados como .HTML
  • Convert Links: una vez completada la descarga, convertirá los enlaces en el documento para que sean adecuados para la visualización local. Esto afecta no solo a los hipervínculos visibles, sino a cualquier parte del documento que se vincule con contenido externo, como imágenes incrustadas, enlaces a hojas de estilo, hipervínculos a contenido no HTML , etc.
  • -m Esto activa las opciones adecuadas para la duplicación.
  • -w 10 Este comando pone 10 segundos entre cada archivo recuperado para que no interfiera con el tráfico del servidor.

Por ejemplo:

wget -html-extension -convert-links -m -w 10 http://ejemplo.com

Usando este comando, cada publicación y página se guardará como un archivo HTML. El sitio se copiará y los enlaces se convertirán para que pueda buscarlos localmente. El último parámetro coloca intervalos de 10 segundos entre cada archivo recuperado para ayudar a evitar la sobrecarga del servidor web.

Tenga en cuenta que se está guardando el resultado de una publicación o página en un archivo HTML. Este método no se debe utilizar como el medio principal de realizar una copia de seguridad de un sitio web.

wget-files

Otras alternativas para hacer backups de página webs sin acceso

Desde hace muchos años, he utilizado el conocido WinHTTrack para realizar backup de páginas webs. Pero conforme la tecnología web ha ido avanzando poco a poco se hace mas difícil recuperar una copia completa de un sitio web sin que falten imágenes o archivos.

WinHTTrack es confuso y difícil de usar, no es para cualquier usuario. A pesar de ello algunos javascripts no los logra recuperar completamente y muchas veces se deja una que otra imagen por fuera sobre todo si el sitio utiliza muchas de las nuevas propiedades de css3.

Con WGET, es completamente posible hacer un backup de una página web sitio a la que no tienes acceso, mas fácil que con cualquier otra herramienta conocida.

Por favor espere, Cargando...
Do NOT follow this link or you will be banned from the site!