La caída de un rayo ha sido el desencadenante de la reciente interrupción de Office 365 y Azure durante más de 24 horas. El rayo golpeó uno de los centros de datos principales provocando que los usuarios de todo el mundo no pudieran acceder a los servicios críticos de Microsoft.La situación meteorológica causó una subida de tensión en el centro de datos South Central US, ubicado en San Antonio, Texas, llegando perder completamente la disponibilidad del centro desde aproximadamente las 10:00 de la mañana hora local del pasado 4 de septiembre.
De acuerdo a Microsoft, su servicio Azure Active Directory se desconectó y afectó a otros productos de de la compañía que dependían de él. La situación ocasionó un efecto en cadena haciendo que algunos usuarios ubicados en los Estados Unidos, Reino Unido, norte de Europa y Australia, perdieron completamente el acceso a Office 365 y otros productos de Microsoft durante más de 24 horas.
El comunicado emitido por la empresa, confirmó que se vieron afectados una gran cantidad de servicios de Office 365, incluidos Exchange, PowerBI, SharePoint y Microsoft Team, al igual que otra variedad de servicios basados en Azure.
As storage-related mitigation progresses, Engineers are in an extended recovery phase. Mitigation is reported for Azure Active Directory and efforts continue for other storage-dependent services. Updates: Portal – https://t.co/p4SEbHGJuY | Status Page – https://t.co/n4GwvG5n3U pic.twitter.com/k2GMQ29bIG
— Azure Support (@AzureSupport) 5 de septiembre de 2018
En el mensaje publicado en el panel de estado de Azure de Microsoft se podía comprobar que un evento meteorológico severo, incluyendo aparato eléctrico, se produjo cerca de uno de sus centros de datos del centro sur de Estados Unidos.
Desde Microsoft se indicó que a raíz del incidente los ingenieros se encontraban priorizando la restauración de los recursos de almacenamiento con la finalidad de recuperar todos los servicios con dependencias de los recursos afectados. “A medida que la recuperación del almacenamiento continúa avanzando, se requiere una fase de posterior de restauración extendida”.
24 horas tras el incidente, los clientes de Azure aún continuaban experimentando diferentes dificultades en los servicios, pese a que ya se habían restablecido otros como Office 365, tras haberse restablecido de la potencia en el centro de datos afectado.
Según se ha podido conocer, tras la recuperación de Office 365 y Azure, Microsoft también confirmó que sus ingenieros se encontraban trabajando activamente para tratar de recuperar las unidades de Azure Storage que dañadas con la finalidad de restaurar completamente los servicios afectados.
Sin acceso a servicios de Microsoft
Diferentes lectores nos han continuado informado de incidencias alrededor de Office 365 y los servicios Azure que afectados, si bien desde Microsoft se asegura que los servicios ya se encuentran prácticamente restablecidos en su totalidad.
Gran parte de los usuarios afectados, así como el grueso de las reclamaciones que se han ido multiplicando en las redes sociales provenían de usuarios de los Países Bajos, Estados Unidos y Suiza. “El incidente de hoy en Azure fue otro claro recordatorio de la necesidad de que las organizaciones construyan su propia redundancia en lugar de depender de un único proveedor”, dijo Pete Banham, experto en resiliencia cibernética de Mimecast.
A su juicio, todas las organizaciones, incluyendo a Microsoft, deben considerar los efectos secundarios que pueden presentarse al perder un servicio crítico debido a fallos técnicos o errores humanos. En este punto también es importante tomar en cuenta los eventos naturales que imprevistos, pues ya se tiene un antecedente más con esta interrupción de Office 365 y Azure causada por un rayo.
“¿Deberían los empleados de todo el mundo que utilizan Office 365 depender de un solo Centro de datos azure ubicado en los Estados Unidos?»
«Los servicios siempre fallarán y los responsables de TI deben asegurarse de no haber subcontratado su responsabilidad a un único proveedor”
La revista digital toma en cuenta los comentarios de Banham para hacerse eco de una investigación publicada a principios de este año donde se sugería que la mayoría de las empresas del Reino Unido, no habían apreciado del todo los inminentes riesgos de una posible interrupción de la nube, con lo cual ponían en riesgo la seguridad de sus datos, informaciones, procesos y negocios en general.
Según las informaciones emanadas de Microsoft, por ahora sus expertos han continuado el trabajo sin descanso para reestablecer completamente los servicios que resultaron interrumpidos por el evento meteorológico.
Según información de las autoridades de San Antonio, donde se produjo el incidente, la ciudad se está preparando para nuevas tormentas los próximos días. Entre tanto, los clientes tendrán que ser pacientes y esperar que los productos de la compañía estén 100% reestablecidos.