• La caída masiva de sitios web del 18 de noviembre no fue causada por un ciberataque.
  • Un cambio en la configuración de permisos de bases de datos afectó al sistema de gestión de bots.
  • Cloudflare pide disculpas por el incidente, el peor en años.

Cloudflare ha desmentido rotundamente que la extensa interrupción de servicios que afectó a numerosos sitios web el pasado 18 de noviembre se debiera a un ataque de denegación de servicio (DDoS). El CEO de la compañía, Matthew Prince, explicó en una entrada de blog que, tras una investigación interna, se determinó que el problema no tuvo origen en ninguna actividad maliciosa. La causa real fue un cambio en los permisos de sus sistemas de bases de datos, que provocó un fallo en un archivo esencial para su sistema de gestión de bots.

Fallo en la gestión de bots, el origen del problema

El sistema de gestión de bots de Cloudflare utiliza un modelo de aprendizaje automático para evaluar cada solicitud que realizan los bots al rastrear la red. Los clientes de Cloudflare confían en estas puntuaciones para decidir si permiten o bloquean el acceso de determinados bots a sus sitios web. Una de las aplicaciones de estas puntuaciones es el bloqueo de bots de empresas de inteligencia artificial para evitar que utilicen contenido web para entrenar sus modelos de lenguaje (LLMs). De hecho, en julio Cloudflare lanzó un experimento llamado "pago por rastreo", que permite a los propietarios de sitios web recibir una compensación si permiten que un bot de IA acceda a sus páginas. Este sistema es crucial para la seguridad y la gestión del tráfico web.

Detalles técnicos del incidente

Prince detalló que el modelo de gestión de bots se basa en un archivo de configuración de "características" para predecir si una solicitud de bot es automatizada o no. Este archivo se actualiza cada pocos minutos. Sin embargo, un cambio en el mecanismo subyacente que generaba dicho archivo provocó una alteración en su tamaño, desencadenando el error. Como consecuencia, el sistema central de proxy de Cloudflare devolvió códigos de error HTTP 5xx para todo el tráfico que dependía del módulo de bots. Este fallo técnico impidió el procesamiento normal del tráfico de los clientes.

La peor caída de servicios en años

Este incidente se ha convertido en la peor interrupción de servicios de Cloudflare en varios años. La compañía señaló que no había experimentado una caída que "causara que la mayoría del tráfico principal dejara de fluir a través de [su] red" desde 2019. Matthew Prince aprovechó para ofrecer disculpas en nombre de todo el equipo por las molestias ocasionadas a los usuarios y clientes. La rápida resolución del problema fue una prioridad para la empresa.