Una ola de calor en curso en el Reino Unido ha provocado interrupciones en Google Cloud y Oracle Cloud después de que fallaran los sistemas de refrigeración en los centros de datos de las empresas.
Durante la última semana, el Reino Unido ha sufrido una ola de calor sin precedentes que ha provocado temperaturas sofocantes en toda la región.
Sin embargo, hoy, con temperaturas que alcanzan un récord de 40,2 grados Celsius (104,4 Fahrenheit), los sistemas de enfriamiento en los centros de datos utilizados por Google y Oracle para alojar su infraestructura en la nube han comenzado a fallar.
Para evitar daños permanentes a los componentes de hardware y, por lo tanto, crear una interrupción prolongada, tanto Google como Oracle han apagado el equipo, lo que provoca interrupciones en sus servicios en la nube.
Oracle fue el primero en verse afectado, y la compañía informó una falla de enfriamiento aproximadamente a las 11:30 a.m. EST de hoy, lo que provocó que se apagara el «hardware no crítico».
«Como resultado de las temperaturas fuera de temporada en la región, un subconjunto de la infraestructura de enfriamiento dentro del centro de datos del sur del Reino Unido (Londres) experimentó un problema. Esto llevó a que un subconjunto de nuestra infraestructura de servicio tuviera que apagarse para evitar fallas de hardware descontroladas». lee un mensaje de estado de Oracle Cloud que parece haber sido detectado por primera vez por TheRegister.
«Este paso se tomó con la intención de limitar el potencial de cualquier impacto a largo plazo para nuestros clientes».
Sin embargo, incluso con el hardware no crítico apagado, Oracle afirma que es posible que los clientes de esta zona no puedan acceder a sus recursos de Oracle Cloud Infrastructure.
Casi dos horas después, Google también informó fallas en el enfriamiento en uno de sus edificios que alberga la zona europe-west2-a para la región europe-west2.
«Hubo una falla relacionada con el enfriamiento en uno de nuestros edificios que alberga la zona europe-west2-a para la región europe-west2. Esto provocó una falla parcial de la capacidad en esa zona, lo que provocó terminaciones de VM y la pérdida de máquinas por un pequeño conjunto de nuestros clientes», se lee en el informe de incidentes de Google Cloud .
«Estamos trabajando arduamente para que la refrigeración vuelva a estar en línea y crear capacidad en esa zona. No anticipamos un mayor impacto en la zona europe-west2-a y las máquinas virtuales que se ejecutan actualmente no deberían verse afectadas. Un pequeño porcentaje de dispositivos de disco persistente replicados son ejecutándose en modo redundante único».
«Para evitar daños a las máquinas y una interrupción prolongada, hemos apagado parte de la zona y estamos limitando los lanzamientos interrumpibles de GCE. Estamos trabajando para restaurar la redundancia para cualquier dispositivo de disco persistente replicado afectado restante».
Al igual que Oracle, esta falla de enfriamiento está interrumpiendo a los clientes de Google Cloud, con máquinas virtuales que se terminan, máquinas inaccesibles y dispositivos de disco persistente que se ejecutan en modo de redundancia única.
Ambas compañías informan que no esperan ningún impacto adicional mientras trabajan para que los sistemas de enfriamiento vuelvan a estar en línea.