Los agentes de inteligencia artificial están por todas partes ahora, y cada vez más aplicaciones dependen de ellos para ejecutar tareas complejas de forma autónoma. Analizan videos, procesan datos, generan código, coordinan otros sistemas y hacen todo esto encadenando varios modelos y herramientas externas para resolver problemas que serían demasiado difíciles para un único modelo por sí solo. Es impresionante, sin duda, pero toda esa autonomía tiene un costo que no siempre aparece en los titulares.
Hay un problema creciendo junto con toda esa popularidad: cuanto más sofisticados se vuelven estos sistemas, más energía, procesamiento y dinero consumen, muchas veces de forma innecesaria. La forma en que estos sistemas altamente fragmentados se diseñan e implementan suele generar ineficiencias que llevan a computación desperdiciada, gasto extra de energía y costos más altos. Multiplicando eso por miles de solicitudes al día, el desperdicio empieza a pesar, tanto en el bolsillo como en el impacto ambiental.
Es ahí donde entra una investigación que llamó bastante la atención recientemente. Investigadores del MIT y de Microsoft desarrollaron un sistema inteligente llamado Murakkab, una palabra en urdu que significa composición de cosas, creado justamente para simplificar el proceso de construcción de los flujos de trabajo agentic y optimizar automáticamente cómo se ejecutan dentro de la computación en la nube.
La idea central es simple de entender:
- En lugar de que un desarrollador necesite configurar manualmente cada detalle técnico de un sistema de agentes
- Describe en lenguaje sencillo lo que quiere que la aplicación haga, sin necesidad de especificar todos los detalles con antelación
- Murakkab hace el resto de forma automática, eligiendo los mejores modelos, herramientas y configuraciones de hardware disponibles
- Y además ajusta todo eso en tiempo real según las prioridades de cada usuario, como minimizar costos o maximizar velocidad
Los resultados de las pruebas fueron bastante expresivos, con reducciones significativas en el consumo de energía y en los costos operativos, sin comprometer el rendimiento. Eso por sí solo ya sería motivo suficiente para prestar atención a esta investigación, pero lo que hace a Murakkab realmente interesante es la forma en que resuelve un problema que la mayoría de las plataformas de agentes de IA aún ignoran por completo. 👇
El problema real detrás de los flujos de trabajo agentic
Cuando empiezas a construir sistemas con agentes de IA, pronto te das cuenta de que la complejidad crece de forma exponencial. Un flujo de trabajo agentic es un sistema compuesto por varios agentes autónomos que colaboran usando diferentes modelos y herramientas, como bases de datos o programas en Python, para completar dinámicamente una tarea de múltiples etapas. Puede ser procesamiento de datos, generación de código o esa aplicación que analiza un video y responde preguntas sobre él. Estos flujos normalmente funcionan entre bastidores, alimentando aplicaciones que el usuario final usa sin siquiera percibir toda la ingeniería detrás.
El problema central es que, en la mayoría de los sistemas actuales, los desarrolladores necesitan dejar todas las decisiones técnicas definidas en el código desde el principio. Necesitan decidir qué agentes, modelos y herramientas usar, en qué orden usar cada uno, qué hardware va a ejecutar el flujo y cómo equilibrar compensaciones como velocidad contra costo. Esto es especialmente complicado porque los flujos agentic reúnen varios modelos de caja negra y herramientas muy diferentes, cada uno con sus propias opciones de configuración, y muchas veces ofrecidos por empresas distintas.
Y hay un detalle que vuelve todo aún más difícil: si un nuevo modelo de IA se lanza y podría mejorar la precisión o la eficiencia de la aplicación, el desarrollador necesitaría empezar todo de nuevo para implementarlo. Como el propio investigador Gohar Chaudhry, estudiante de posgrado en ingeniería eléctrica y ciencia de la computación en el MIT y autor principal del estudio, explica, incluso si alguien quisiera hacer toda esa configuración manualmente, difícilmente conseguiría llegar al resultado óptimo, porque el espacio de configuraciones posibles es simplemente gigante.
Para empeorar las cosas, el centro de datos en la nube que implementa la aplicación para los clientes no puede ver dentro del flujo para asignar los recursos de hardware de la forma más eficiente en el momento exacto de la solicitud del usuario. Es exactamente ese conjunto de problemas el que Murakkab vino a resolver, optimizando el proceso completo de extremo a extremo.
Cómo funciona Murakkab en la práctica
Murakkab opera como una capa de optimización que se sitúa entre la aplicación y la infraestructura de nube. Primero, permite que el desarrollador cree un flujo de trabajo agentic simplemente describiendo la intención de la aplicación en términos de alto nivel, sin necesidad de detallar cómo debe combinarse cada componente. Por ejemplo, alguien puede describir una aplicación de preguntas y respuestas sobre videos que extrae fotogramas clave, genera una transcripción y luego responde a las consultas del usuario sobre ese video.
El detalle es que existen muchas maneras de hacer esto, y cada combinación de modelos y herramientas tiene implicaciones directas en qué tan rápido la aplicación logra completar la tarea. Murakkab toma esas especificaciones simples del desarrollador e identifica automáticamente los mejores modelos y herramientas existentes para montar el flujo. También determina qué componentes necesitan ejecutarse en secuencia y cuáles pueden ejecutarse en paralelo para aumentar el rendimiento.
Una de las partes más sofisticadas del sistema es justamente esa adaptabilidad en tiempo real. Como Murakkab toma las decisiones de configuración dinámicamente a lo largo del tiempo, si un nuevo modelo o un nuevo acelerador de GPU se lanza mañana, el desarrollador no necesita preocuparse por nada de eso. Cuando el proveedor de nube implementa la aplicación para un cliente, Murakkab configura los componentes del flujo para cumplir con las restricciones del usuario, como priorizar precisión respetando un requisito de latencia. Identifica de forma adaptativa las asignaciones ideales de hardware y los cronogramas de implementación para maximizar la eficiencia en tiempo real, y luego genera un flujo listo para que el proveedor lo ejecute.
Otra ganancia importante es que el sistema le da al proveedor de nube visibilidad sobre múltiples cargas de trabajo al mismo tiempo. Con esto, el proveedor logra compartir recursos computacionales de la manera más eficiente posible, satisfaciendo las restricciones de cada usuario. La inteligencia del sistema está en conseguir hacer ese balanceo dinámico de recursos de forma transparente, manteniendo los criterios de calidad definidos por el usuario mientras minimiza todo lo que es innecesario en el proceso.
Los números que comprueban la eficiencia
Los benchmarks divulgados por los investigadores fueron bastante convincentes. Cuando se probó en diversos flujos de trabajo agentic, como preguntas y respuestas sobre video y generación de código, Murakkab cumplió con los requisitos de los usuarios usando apenas alrededor del 35% de la computación exigida por otros métodos. Consumió solo cerca del 27% de la energía y costó menos del 25% del valor de los enfoques tradicionales. Son reducciones enormes, y lo mejor es que llegaron sin perjudicar la calidad de las respuestas generadas.
La naturaleza dinámica del sistema también permite a los usuarios equilibrar compensaciones con bastante flexibilidad. En uno de los casos probados, el sistema redujo el consumo de energía de un flujo de trabajo en más de un orden de magnitud, con una caída de apenas cerca del 2% en la precisión para el cliente. Murakkab además logró identificar una configuración inesperadamente ideal para un modelo que selecciona fotogramas de video, optimizando el rendimiento de una tarea de preguntas y respuestas. Ese tipo de optimización sería prácticamente imposible de hacer manualmente, según Chaudhry. La combinación de MIT y Microsoft detrás del proyecto también es una señal de que esta investigación tiene tanto rigor académico como aplicabilidad industrial. El estudio, por cierto, será presentado en el USENIX Symposium on Operating Systems Design and Implementation.
Por qué esto importa para el futuro de los agentes de IA
La conversación sobre sostenibilidad en la inteligencia artificial se está poniendo cada vez más seria, y con razón. Los grandes modelos de lenguaje ya consumen volúmenes absurdos de energía solo para existir, y cuando empiezas a escalar flujos de trabajo agentic en producción, ese consumo crece de una forma que muchas empresas todavía no están contabilizando bien. Como el propio Chaudhry destaca, es muy fácil asignar recursos de más, desperdiciando energía y dinero, y permitir que un proveedor de nube haga esos flujos más eficientes de forma inteligente es una victoria para todos los involucrados.
La eficiencia energética dejó de ser una preocupación secundaria y se convirtió en un criterio real de decisión arquitectónica, especialmente para empresas que tienen metas de sostenibilidad o que operan en mercados donde el costo de infraestructura es determinante para la viabilidad del producto. Los flujos agentic se están convirtiendo rápidamente en la columna vertebral de lo que los proveedores de nube ofrecen, y cuidar de cuán eficientes son dejó de ser opcional.
Desde el punto de vista técnico, Murakkab representa un cambio de paradigma importante en la forma en que pensamos la optimización de sistemas agentic. Hasta ahora, la tendencia era resolver problemas de rendimiento lanzando más recursos al problema, usando modelos más grandes, más memoria, más paralelismo. Lo que esta investigación propone es el camino opuesto: usar menos recursos de forma más inteligente, dejando que un sistema de orquestación tome las decisiones que un humano tardaría demasiado en tomar manualmente a escala. Esto tiene implicaciones directas no solo para la eficiencia operativa, sino también para la democratización del uso de agentes de IA, ya que sistemas más económicos quedan accesibles para equipos más pequeños y con presupuestos más limitados.
Y hay otro ángulo que vale la pena destacar: la complejidad de gestionar flujos de trabajo agentic en producción es uno de los mayores obstáculos para la adopción a escala de estas tecnologías hoy. Cuanto más el trabajo de optimización pueda ser automatizado y abstraído hacia una capa inteligente como Murakkab, más los desarrolladores logran enfocarse en lo que realmente importa, que es construir la lógica de negocio de los agentes en lugar de gastar tiempo gestionando infraestructura.
Los próximos pasos del equipo incluyen expandir el sistema a flujos de trabajo aún más complejos y clústeres de computación más grandes, explorando oportunidades de optimizar nuevas aplicaciones agentic. Como resume Chaudhry, existe mucho potencial para hacer estos flujos más económicos en recursos, de modo que consuman mucha menos energía, pero es necesario pensar en esto a la escala de las grandes plataformas de nube. Esta investigación, apoyada en parte por la Semiconductor Research Corporation y DARPA, apunta hacia un camino donde la computación en la nube para IA se vuelve no solo más barata y sostenible, sino también más simple de usar. Y eso es el tipo de avance que tiene potencial real de cambiar cómo la industria construye estas aplicaciones en los próximos años. 🚀
