• La Wayback Machine archiva 150 TB de páginas web cada día.
  • El Internet Archive se encuentra físicamente en una antigua iglesia en San Francisco.
  • La colección completa de la Wayback Machine supera los 175 petabytes de datos.

La Wayback Machine, el servicio de archivo web del Internet Archive, está operando a una escala asombrosa, guardando aproximadamente 150 terabytes (TB) de datos de páginas web cada día. Este vasto repositorio digital, que alberga 29 años de historia de internet, se encuentra en parte en un edificio emblemático de San Francisco: una antigua iglesia cristiana de la ciencia en Funston Avenue. Lo que comenzó en 1996 con apenas 2 TB de almacenamiento anuales, ahora consume 150 TB en solo 24 horas, y la totalidad del archivo ya supera los 175 petabytes.

El archivo digital más grande del mundo

El Internet Archive no solo se dedica a las páginas web; su labor de preservación abarca una cantidad ingente de contenido multimedia. Actualmente, la colección incluye 49 millones de libros, 13 millones de grabaciones de audio (con 268.000 conciertos en vivo), 10 millones de vídeos (entre ellos, 3 millones de programas de noticias televisivas), 5 millones de imágenes y 1 millón de programas de software. La organización comenzó a digitalizar libros en 2005, escaneando 4.400 volúmenes diarios en 20 localizaciones globales, y desde el año 2000 archiva programas de televisión, con un enfoque especial en las noticias.

Preservación frente a la censura

La ubicación física principal de los servidores del archivo se encuentra en un almacén a las afueras de San Francisco, aunque copias de seguridad se distribuyen por todo el mundo. Esta estrategia de redundancia es crucial, no solo para protegerse de catástrofes físicas, sino también ante posibles eliminaciones de contenido por parte de administraciones. El fundador, Brewster Kahle, señaló que cambios políticos han llevado a la eliminación de grandes secciones de la web, subrayando la importancia de bibliotecas como la suya para mantener un registro histórico accesible.

 

Innovación y futuro de la preservación digital

Además de su labor de archivo tradicional, el Internet Archive está explorando nuevas fronteras para preservar la información. Recientemente, han iniciado experimentos para documentar cómo las personas interactúan con las noticias a través de chatbots. Para ello, generan cientos de preguntas y respuestas diarias basadas en la actualidad, registrando tanto las consultas como los resultados. Esta iniciativa demuestra el compromiso de la organización por adaptarse a los nuevos formatos de consumo de información y asegurar su preservación para el futuro.

Acceso y visitas al archivo

Los libros publicados antes de 1929 están disponibles para su descarga, y cientos de miles de títulos modernos se pueden tomar prestados a través de su sitio Open Library. A pesar de haber enfrentado desafíos legales, como la retirada de 500.000 libros tras una apelación perdida, la organización mantiene su misión. Para los interesados en conocer de cerca sus instalaciones, el Internet Archive ofrece visitas guiadas gratuitas los viernes a la 1 p.m. en su sede de San Francisco.