Recuperar paginas web borradas

Máquina Wayback

Si por casualidad ha encontrado este artículo porque recientemente ha sido víctima de la pérdida de su sitio web, entendemos que puede ser una de las peores situaciones que le pueden ocurrir a su negocio.  Mientras que muchos lo restregarán como una “lección difícil de respaldar” no cambia el hecho de que es una amarga realidad.

Dado que muchas personas que se conectan con nosotros han experimentado esto recientemente (sin nombrar ningún nombre de empresa) nos sentimos por cada individuo. Por eso sentimos que era nuestro deber crear un artículo para proporcionar algunas orientaciones sobre los pasos que puede y debe tomar si acaba de perder su sitio.

Este recurso le guiará en el proceso de recuperación y le ayudará a lanzar un sitio web más fiable, rápido, flexible y bonito. Nota: El caso ideal es que reproduzca exactamente el mismo sitio que tenía antes (estructura, URLs, contenido, etc.). Sin embargo, esto no es una tarea fácil.

Si algunos de los pasos compartidos le resultan abrumadores, necesita más ayuda o no está seguro de algún paso, no dude en ponerse en contacto con nosotros a través de nuestra página de contacto y estaremos encantados de explicárselo u ofrecerle sugerencias.

Google encuentra páginas web antiguas

31 de agosto. 2021Incluso para las personas más cuidadosas, a veces sucede que borras accidentalmente algunas de tus publicaciones o páginas. O bien, las borras a propósito pero cambias de opinión más tarde. Sin embargo, no importa la razón detrás de él, hay maneras que usted puede recuperar y restaurar las páginas eliminadas en WordPress. A veces es fácil y sólo necesitarás unos pocos clics para recuperar tus páginas. Pero, en algunos casos, puede que necesites trabajar un poco más para restaurarlas.

En general, WordPress tiene un mecanismo incorporado que guarda las páginas eliminadas durante un tiempo. Es la “Papelera”, algo así como la opción de Papelera de Reciclaje que puedes ver en los sistemas operativos de Windows. Todas las páginas que elimines irán allí y se mantendrán dentro durante un periodo determinado. Una vez que el periodo expira (normalmente unos 30 días), tendrás que utilizar otros métodos menos convencionales para encontrar, recuperar y restaurar las páginas eliminadas. Si el mantenimiento de su sitio web es profesional, no tendrá que preocuparse por esto. Pero puede ser muy útil saber cómo hacerlo por tu cuenta.

Acceder a sitios web eliminados

(Sí, sí, debería haber hecho copias de seguridad completas fuera del sitio. Por desgracia, todas mis copias de seguridad estaban en el propio servidor. Así que ahórrate el sermón; tienes toda la razón, pero eso no me ayuda en este momento. Centrémonos en la cuestión).

Aquí está mi apuesta salvaje en la oscuridad: configure su servidor web para devolver 304 para cada solicitud de imagen, a continuación, crowd-source la recuperación mediante la publicación de una lista de direcciones URL en algún lugar y pidiendo en el podcast para todos sus lectores para cargar cada URL y la cosecha de las imágenes que se cargan de sus cachés locales. (Esto sólo puede funcionar después de restaurar las propias páginas HTML, completas con las etiquetas <img …>, lo que su pregunta parece implicar que podrá hacer).

Esto es básicamente una forma elegante de decir: “sácalo de las cachés de los navegadores de tus lectores”. Usted tiene muchos lectores y oyentes de podcast, por lo que puede movilizar eficazmente a un gran número de personas que probablemente hayan visto su sitio web recientemente. Pero encontrar y extraer manualmente las imágenes de las cachés de varios navegadores web es difícil, y todo el enfoque funciona mejor si es lo suficientemente fácil como para que mucha gente lo intente y tenga éxito. De ahí el enfoque 304. Todo lo que requiere de los lectores es que hagan clic en una serie de enlaces y arrastren las imágenes que se cargan en su navegador (o hagan clic con el botón derecho y guarden como, etc.) y luego te las envíen por correo electrónico o las suban a una ubicación central que tú establezcas, o lo que sea. El principal inconveniente de este método es que las memorias caché de los navegadores no se remontan tan lejos en el tiempo. Pero basta con que un lector cargue un post de 2006 en los últimos días para rescatar incluso una imagen muy antigua. Con una audiencia suficientemente grande, todo es posible.

Restaurar el historial de Chrome

Wayback Machine es el famoso y mayor archivo de páginas web del mundo. Tiene más de 400 mil millones de páginas en sus servidores. ¿Existe algún servicio de archivo como Archive.org? Sí, hay algunos servicios alternativos, pero todos ellos no son más que una fina sombra de archive.org. La principal diferencia entre el Archivo de Internet y todas las alternativas es el tamaño. Archive.org es mucho más grande que todos ellos.

Hay unos 25 clones pequeños y locales de archive.org, todos ellos con bases de datos muy limitadas. Este sitio web – timetravel.mementoweb.org es un motor de búsqueda de viajes en el tiempo para archivos web. También puede ayudarte a encontrar contenidos borrados. Time Travel busca páginas en caché en archive.org, archive.is y en algunos lugares extraños como Icelandic Web Archive o Web Archive Singapore. Puedes encontrar la lista de servicios de archivo existentes en su página web – http://timetravel.mementoweb.org/about/

Hace tres años, el 29 de septiembre de 2017, se puso en marcha nuestro servicio de descarga de archive.org. Todos estos 3 años hemos estado en continuo desarrollo, hemos creado nuestro propio CMS, un plugin de WordPress, un sistema…