HPE (Hewlett Packard Enterprise) ha estado colaborando en I + D (Investigación + Desarrollo) de IA Ops (Inteligencia Artificial para Operaciones) con el Laboratorio Nacional de Energía Renovable (NREL) del Departamento de Energía de Estados Unidos.
El objetivo ha sido desarrollar tecnologías de Inteligencia Artificial (IA) y Aprendizaje Automático (Machine Learning, ML) para automatizar y mejorar la eficiencia operativa.
Esto incluye la capacidad de recuperación y el uso de energía en los centros de datos para la era del exascale (capacidad de realizar 1 exaflop u operaciones de coma flotante por segundo).
El esfuerzo ha formado parte de la misión continua del NREL para el avance de la eficiencia energética y las tecnologías de energía renovable que creen e implementen nuevos enfoques que reduzcan el consumo de energía y los costos operativos.
“El proyecto es parte de una colaboración de tres años que introduce el monitoreo y el análisis predictivo de los sistemas de energía y enfriamiento en el Centro de datos HPC del Centro de Integración de Sistemas de Energía (ESIF) del NREL”.
HPE y el NREL están utilizando datos históricos de más de cinco años, que suman más de 16 terabytes de datos recopilados de sensores en las supercomputadoras de NREL, Peregrine y Eagle, así como en sus instalaciones.
La intención ha sido entrenar modelos para la detección de anomalías que predigan y prevengan problemas antes de que ocurran.
Además, la colaboración ha abordado el consumo futuro de energía y agua en los centros de datos, que solo en los Estados Unidos se estimaba que alcanzaría aproximadamente 73 mil millones de kWh y 174 mil millones de galones de agua para el año pasado.
Es por esto que HPE y el NREL se centran en monitorear el uso de energía para optimizar la eficiencia energética y la sostenibilidad, medida por métricas claves como la eficacia del uso de energía (PUE), la eficacia del uso del agua (WUE) y la eficacia del uso del carbono (CUE).
Los primeros resultados, basados en modelos entrenados con datos históricos, han predicho o identificado exitosamente eventos que ocurrieron previamente en el centro de datos de NREL, lo que demuestra la promesa de usar análisis predictivos en futuros centros de datos.
El proyecto AI Ops
El proyecto AI Ops ha surgido de los esfuerzos de I+D de HPE relacionados con PathForward, un programa respaldado por el Departamento de Energía de los Estados Unidos para acelerar la hoja de ruta tecnológica de la nación para la computación a gran escala, lo que representa el próximo gran salto en la supercomputación.
En HPE se han percatado de la necesidad crítica de desarrollar capacidades de Inteligencia Artificial y automatización para administrar y optimizar los entornos de centros de datos para la era del exascale.
Entonces, la aplicación de operaciones impulsadas por IA a una supercomputadora exascale, que se ejecuta a una velocidad que representa un aumento de mil veces sobre los sistemas actuales, permitiría operaciones de eficiencia energética y aumentaría la resistencia y la confiabilidad a través de capacidades inteligentes y automatizadas.
Mike Vildibill, vicepresidente del Grupo de Tecnologías Avanzadas de HPE, ha comentado que en la compañía les apasiona la arquitectura de nuevas tecnologías que son impactantes para impulsar la próxima era de la innovación con la computación exascale y su alcance de las necesidades operativas.
“Creemos que nuestro viaje para desarrollar y probar AI Ops con NREL, uno de nuestros socios innovadores y de larga data, permitirá a la industria construir y mantener centros de datos de supercomputación más inteligentes y más eficientes a medida que continúan aumentando la potencia y el rendimiento”.
Por su parte, Kristin Munch, gerente del Grupo de Datos, Análisis y Visualización del NREL, ha confirmado que la colaboración de investigación abarca las áreas de gestión de datos, análisis de datos y optimización de AI / ML para la intervención manual y autónoma en las operaciones del centro de datos.
“Estamos entusiasmados de unirnos a HPE en este esfuerzo de varios años y etapas, y esperamos desarrollar capacidades para una instalación inteligente avanzada después de demostrar estas técnicas en nuestro centro de datos existente”, señaló.