Un error humano durante la reconfiguración de un enrutador ha causado la interrupción de toda la red de OVH, uno de los principales proveedores de servicios de Internet (ISP) y Cloud Computing (Computación en la Nube) a escala mundial.
Octava Klaba, CEO de OVH, ha confirmado en su cuenta de Twitter la caída que afectó a miles de clientes de la compañía, admitiendo que el error se ha registrado en su DC VH (Data Center Vint Hill) de Estados Unidos.
“Tenemos un problema en toda la red troncal. Aislaremos el DC VH y luego arreglaremos la configuración”.
El equipo de ingeniería ya había anunciado el mantenimiento en sus enrutadores en VIN DC para mejorar su enrutamiento, trabajos que estaban previstos para el 13 de octubre de 2021 durante hora y media (9:00 / 10:30 am UTC + 2).
Aunque no se esperaba ningún impacto y el dispositivo se aislaría antes del cambio, desde la compañía se ha admitido el error a las 9:12 am (CET / hora de París).
“Estas intervenciones tenían como objetivo reforzar nuestras protecciones anti-DDoS, ataques que han sido especialmente intensos en las últimas semanas”.
La situación ha provocado que los equipos de OVHcloud intervengan rápidamente para aislar el equipo a las 10:15 horas y los servicios se han restablecido desde esta maniobra.
La compañía ha realizado una campaña de verificación con sus clientes para confirmar la restauración de todos sus servicios y ha ofrecido sus “más sinceras disculpas” a todos los afectados.
Mal día para la cloud
La caída de los servicios de OVH ha sucedido a solo nueve días de un incidente similar en la red de Facebook. Algunos cambios errados de configuración en los enrutadores troncales (que coordinan el tráfico de red entre sus centros de datos) causaron la interrupción de la plataforma y su familia de aplicaciones: Instagram, Facebook, WhatsApp.
“Esta interrupción del tráfico de la red tuvo un efecto en cascada en la forma en que se comunican nuestros centros de datos, lo que paralizó nuestros servicios”.
La cita corresponde a Santosh Janardhan, vicepresidente de Infraestructura de Facebook, quien en su momento confirmó que la caída afectó a muchas herramientas y sistemas internos que utilizan en sus operaciones diarias, lo que habría complicado el pronto diagnóstico y solución del problema.
En marzo de este año, OVH también ha enfrentado dos incendios en sus DC de Francia. Apenas se cumplían 10 días del devastador incendio que consumió el DataCenter SBG2, en Estrasburgo, cuando el viernes 19 de marzo se volvió a declarar un nuevo foco de incendio en otro de los Centros de Datos de la compañía. Ambos incidentes causaron la interrupción de sus servicios.
Negocios Tv, un canal de televisión especializado en información financiera en español, ha sido uno de los afectados con esta caída de OVH porque contrata su alojamiento web con la compañía francesa. Así como esta, han sido miles de empresas que han visto interrumpidos sus servicios de nube e Internet.
Problemas con VM Azure
Pero esto no ha sido todo lo ocurrido en el mundo cloud este miércoles 13 de octubre de 2021. Desde las 5:12 UTC un subconjunto de clientes que utilizan Máquinas Virtuales (VM) de Windows (Azure) pudieron experimentar notificaciones de fallas al realizar operaciones de administración de servicios (iniciar, crear, actualizar y eliminar).