
Imagen de IA generada por ChatGPT
2026-04-29
Una forma más rápida de estimar el consumo de energía de la IA
Debido al crecimiento explosivo de la inteligencia artificial, se estima que los centros de datos consumirán hasta el 12 por ciento de toda la electricidad de EE. UU. para 2028, según el Laboratorio Nacional Lawrence Berkeley. Mejorar la eficiencia energética de los centros de datos es una de las formas en las que los científicos están buscando que la IA sea más sostenible.
Con ese objetivo, investigadores del MIT y del MIT-IBM Watson AI Lab desarrollaron una herramienta de predicción rápida que indica a los operadores de centros de datos cuánta energía se consumirá al ejecutar una determinada carga de trabajo de IA en un procesador o chip acelerador de IA concreto.
Su método produce estimaciones fiables de energía en pocos segundos, a diferencia de las técnicas de modelado tradicionales, que pueden tardar horas o incluso días en arrojar resultados. Además, su herramienta de predicción se puede aplicar a una amplia variedad de configuraciones de hardware, incluso a diseños emergentes que aún no se han implementado.
Los operadores de centros de datos podrían utilizar estas estimaciones para asignar de manera más efectiva los recursos limitados entre varios modelos y procesadores de IA, mejorando la eficiencia energética. Además, esta herramienta podría permitir a los desarrolladores de algoritmos y proveedores de modelos valorar el consumo potencial de energía de un nuevo modelo antes de su despliegue.
“El desafío de la sostenibilidad de la IA es una cuestión urgente que debemos responder. Dado que nuestro método de estimación es rápido, conveniente y ofrece retroalimentación directa, esperamos que motive a los desarrolladores de algoritmos y a los operadores de centros de datos a pensar más en reducir el consumo energético”, señala Kyungmi Lee, investigadora postdoctoral del MIT y autora principal de un artículo sobre esta técnica.
En el trabajo la acompañan Zhiye Song, estudiante de posgrado en ingeniería eléctrica y ciencias de la computación; Eun Kyung Lee y Xin Zhang, directores de investigación en IBM Research y el MIT-IBM Watson AI Lab; Tamar Eilam, IBM Fellow, científica jefe de computación sostenible en IBM Research y miembro del MIT-IBM Watson AI Lab; y el autor sénior Anantha P. Chandrakasan, rector del MIT, Profesor Vannevar Bush de Ingeniería Eléctrica y Ciencias de la Computación y miembro del MIT-IBM Watson AI Lab. La investigación se presenta esta semana en el Simposio Internacional IEEE sobre el Análisis del Rendimiento de Sistemas y Software.
Acelerando la estimación energética
Dentro de un centro de datos, miles de potentes unidades de procesamiento gráfico (GPU) realizan operaciones para entrenar y desplegar modelos de IA. El consumo de energía de una GPU concreta variará en función de su configuración y de la carga de trabajo que maneje.
Muchos de los métodos tradicionales para predecir el consumo de energía implican desglosar una carga de trabajo en pasos individuales y emular cómo se utiliza cada módulo dentro de la GPU paso a paso. Pero las cargas de trabajo de IA, como el entrenamiento de modelos y la preprocesamiento de datos, son extremadamente grandes y su simulación puede tardar horas o incluso días en realizarse de esta forma.
“Como operador, si quiero comparar distintos algoritmos o configuraciones para encontrar la forma más eficiente energéticamente de proceder, si una sola emulación va a tardar días, eso resulta muy poco práctico”, afirma Lee.
Para acelerar el proceso de predicción, los investigadores del MIT quisieron usar información menos detallada que pudiera estimarse más rápido. Descubrieron que las cargas de trabajo de IA a menudo incluyen numerosos patrones repetitivos. Pudieron usar estos patrones para generar la información necesaria para una estimación energética confiable pero rápida.
En muchos casos, los desarrolladores de algoritmos programan para que sus sistemas funcionen de la forma más eficaz posible en una GPU. Por ejemplo, aplican optimizaciones bien estructuradas para distribuir el trabajo entre los núcleos de procesamiento en paralelo y mover bloques de datos de la manera más eficiente.
“Estas optimizaciones empleadas por los desarrolladores de software generan una estructura regular, y eso es lo que intentamos aprovechar”, explica Lee.
Los investigadores desarrollaron un modelo de estimación liviano, denominado EnergAIzer, que capta el patrón de uso de energía de una GPU a partir de esas optimizaciones.
Una evaluación precisa
Pero aunque su estimación era rápida, los investigadores descubrieron que no consideraba todos los costes energéticos. Por ejemplo, cada vez que una GPU ejecuta un programa, existe un coste energético fijo para preparar y configurar ese programa. Luego, cada vez que la GPU ejecuta una operación sobre un bloque de datos, se debe pagar un coste energético adicional.
Debido a las fluctuaciones del hardware o a conflictos en el acceso o movimiento de datos, la GPU podría no ser capaz de utilizar todo el ancho de banda disponible, lo que ralentiza las operaciones y aumenta el consumo de energía con el tiempo.
Para incluir estos costes y variaciones adicionales, los investigadores recopilaron mediciones reales de GPU para generar términos de corrección que aplicaron sobre su modelo de estimación.
“De este modo, podemos obtener una estimación rápida que además es muy precisa”, afirma.
Al final, un usuario puede proporcionar la información de su carga de trabajo, como el modelo de IA que desea ejecutar y la cantidad y extensión de las entradas de usuario a procesar, y EnergAIzer ofrecerá una estimación del consumo de energía en cuestión de segundos.
El usuario también puede modificar la configuración de la GPU o ajustar la velocidad de operación para ver cómo influyen tales decisiones de diseño en el consumo energético total.
Cuando los investigadores probaron EnergAIzer con información real de cargas de trabajo de IA en GPUs reales, la herramienta logró estimar el consumo de energía con solo un 8 por ciento de error, lo que es comparable con los métodos tradicionales que pueden tardar horas en producir resultados.
Su método también podría usarse para predecir el consumo de energía de futuras GPU y configuraciones de dispositivos emergentes, siempre que el hardware no cambie drásticamente en poco tiempo.
En el futuro, los investigadores quieren probar EnergAIzer con las configuraciones de GPU más recientes y escalar el modelo para aplicarlo a varias GPU que colaboren para ejecutar una carga de trabajo.
“Para tener un verdadero impacto en la sostenibilidad, necesitamos una herramienta que proporcione una solución rápida de estimación energética en toda la cadena, para diseñadores de hardware, operadores de centros de datos y desarrolladores de algoritmos, de modo que todos sean más conscientes del consumo de energía. Con esta herramienta, hemos dado un paso hacia ese objetivo”, concluye Lee.
Esta investigación fue financiada, en parte, por el MIT-IBM Watson AI Lab.

MIT
Promover la investigación, las innovaciones, la enseñanza y los eventos y las personas de interés periodístico del MIT a la comunidad del campus, los medios de comunicación y el público en general, Comunicar anuncios del Instituto, Publicar noticias de la comunidad para profesores, estudiantes, personal y ex alumnos del MIT. Proporcionar servicios de medios a los miembros de la comunidad, incluido el asesoramiento sobre cómo trabajar con periodistas, Responder a consultas de los medios y solicitudes de entrevistas...