Agentes AI: otimização e eficiência em nuvem

Os agentes de inteligência artificial estão em todo lugar agora, e cada vez mais aplicações dependem deles para executar tarefas complexas de forma autônoma. Eles analisam vídeos, processam dados, geram código, coordenam outros sistemas e fazem tudo isso encadeando vários modelos e ferramentas externas para resolver problemas que seriam difíceis demais para um único modelo enfrentar sozinho. É impressionante, sem dúvida, mas essa autonomia toda tem um custo que nem sempre aparece nos headlines.

Tem um problema crescendo junto com essa popularidade toda: quanto mais sofisticados esses sistemas ficam, mais energia, processamento e dinheiro eles consomem, muitas vezes de forma desnecessária. A forma como esses sistemas altamente fragmentados são projetados e implantados costuma gerar ineficiências que levam a computação desperdiçada, gasto extra de energia e custos mais altos. Multiplicando isso por milhares de requisições por dia, o desperdício começa a pesar, tanto no bolso quanto no impacto ambiental.

É aí que entra uma pesquisa que chamou bastante atenção recentemente. Pesquisadores do MIT e da Microsoft desenvolveram um sistema inteligente chamado Murakkab, uma palavra em urdu que significa composição de coisas, criado justamente para simplificar o processo de construção dos fluxos de trabalho agentic e otimizar automaticamente como eles são executados dentro da computação em nuvem.

A ideia central é simples de entender:

Em vez de um desenvolvedor precisar configurar manualmente cada detalhe técnico de um sistema de agentes
Ele descreve em linguagem simples o que quer que a aplicação faça, sem precisar especificar todos os detalhes com antecedência
O Murakkab faz o resto de forma automática, escolhendo os melhores modelos, ferramentas e configurações de hardware disponíveis
E ainda ajusta tudo isso em tempo real conforme as prioridades de cada usuário, como minimizar custos ou maximizar velocidade

Os resultados dos testes foram bastante expressivos, com reduções significativas no consumo de energia e nos custos operacionais, sem comprometer a performance. Isso por si só já seria motivo suficiente para prestar atenção nessa pesquisa, mas o que torna o Murakkab realmente interessante é a forma como ele resolve um problema que a maioria das plataformas de agentes de IA ainda ignora completamente. 👇

Como Implementar as Melhores Ferramentas de IA

Um guia prático para avaliar, comparar e implementar inteligência artificial com clareza — sem desperdício de tempo ou dinheiro.

Pare de contratar ferramentas sem direção. Criamos um método estruturado para decidir qual IA realmente faz sentido para o seu negócio.

Entrega em PDF no seu e-mail · Sem spam · LGPD

🔒 Seus dados são protegidos conforme a LGPD. Você pode descadastrar a qualquer momento.

O problema real por trás dos fluxos de trabalho agentic

Quando você começa a construir sistemas com agentes de IA, logo percebe que a complexidade cresce de forma exponencial. Um fluxo de trabalho agentic é um sistema composto por vários agentes autônomos que colaboram usando diferentes modelos e ferramentas, como bancos de dados ou programas em Python, para completar dinamicamente uma tarefa de múltiplas etapas. Pode ser processamento de dados, geração de código ou aquela aplicação que analisa um vídeo e responde perguntas sobre ele. Esses fluxos normalmente funcionam nos bastidores, alimentando aplicações que o usuário final usa sem nem perceber toda a engenharia por trás.

O problema central é que, na maioria dos sistemas atuais, os desenvolvedores precisam deixar todas as escolhas técnicas definidas no código desde o começo. Eles precisam decidir quais agentes, modelos e ferramentas usar, em que ordem usar cada um, qual hardware vai rodar o fluxo e como equilibrar trocas como velocidade contra custo. Isso é especialmente complicado porque os fluxos agentic reúnem vários modelos de caixa-preta e ferramentas bem diferentes, cada um com suas próprias opções de configuração, e muitas vezes oferecidos por empresas distintas.

E tem um detalhe que torna tudo ainda mais difícil: se um novo modelo de IA é lançado e poderia melhorar a precisão ou a eficiência da aplicação, o desenvolvedor precisaria começar tudo de novo para implementá-lo. Como o próprio pesquisador Gohar Chaudhry, estudante de pós-graduação em engenharia elétrica e ciência da computação no MIT e autor principal do estudo, explica, mesmo que alguém quisesse fazer toda essa configuração manualmente, dificilmente conseguiria chegar no resultado ótimo, porque o espaço de configurações possíveis é simplesmente gigante.

Para piorar, o data center na nuvem que implanta a aplicação para os clientes não consegue enxergar dentro do fluxo para alocar os recursos de hardware da forma mais eficiente no momento exato da requisição do usuário. É exatamente esse conjunto de problemas que o Murakkab veio preencher, otimizando o processo inteiro de ponta a ponta.

Como o Murakkab funciona na prática

O Murakkab opera como uma camada de otimização que fica entre a aplicação e a infraestrutura de nuvem. Primeiro, ele permite que o desenvolvedor crie um fluxo de trabalho agentic apenas descrevendo a intenção da aplicação em termos de alto nível, sem precisar detalhar como cada componente deve ser combinado. Por exemplo, alguém pode descrever uma aplicação de perguntas e respostas sobre vídeos que extrai quadros-chave, gera uma transcrição e depois responde às consultas do usuário sobre aquele vídeo.

O detalhe é que existem muitas maneiras de fazer isso, e cada combinação de modelos e ferramentas tem implicações diretas em quão rápido a aplicação consegue concluir a tarefa. O Murakkab pega essas especificações simples do desenvolvedor e identifica automaticamente os melhores modelos e ferramentas existentes para montar o fluxo. Ele também determina quais componentes precisam rodar em sequência e quais podem rodar em paralelo para aumentar a performance.

Uma das partes mais sofisticadas do sistema é justamente essa adaptabilidade em tempo real. Como o Murakkab toma as decisões de configuração dinamicamente ao longo do tempo, se um novo modelo ou um novo acelerador de GPU for lançado amanhã, o desenvolvedor não precisa se preocupar com nada disso. Quando o provedor de nuvem implanta a aplicação para um cliente, o Murakkab configura os componentes do fluxo para atender às restrições do usuário, como priorizar precisão respeitando um requisito de latência. Ele identifica de forma adaptativa as alocações ideais de hardware e os cronogramas de implantação para maximizar a eficiência em tempo real, e então gera um fluxo pronto para o provedor executar.

Outro ganho importante é que o sistema dá ao provedor de nuvem visibilidade sobre múltiplas cargas de trabalho ao mesmo tempo. Com isso, o provedor consegue compartilhar recursos computacionais da maneira mais eficiente possível, satisfazendo as restrições de cada usuário. A inteligência do sistema está em conseguir fazer esse balanceamento dinâmico de recursos de forma transparente, mantendo os critérios de qualidade definidos pelo usuário enquanto minimiza tudo o que é desnecessário no processo.

Os números que comprovam a eficiência

Os benchmarks divulgados pelos pesquisadores foram bem convincentes. Quando testado em diversos fluxos de trabalho agentic, como perguntas e respostas sobre vídeo e geração de código, o Murakkab atendeu aos requisitos dos usuários usando apenas cerca de 35% da computação exigida por outros métodos. Ele consumiu apenas cerca de 27% da energia e custou menos de 25% do valor das abordagens tradicionais. São reduções enormes, e o melhor é que vieram sem prejudicar a qualidade das respostas geradas.

A natureza dinâmica do sistema também permite aos usuários equilibrar trocas com bastante flexibilidade. Em um dos casos testados, o sistema reduziu o consumo de energia de um fluxo de trabalho em mais de uma ordem de magnitude, com uma queda de apenas cerca de 2% na precisão para o cliente. O Murakkab ainda conseguiu identificar uma configuração inesperadamente ideal para um modelo que seleciona quadros de vídeo, otimizando a performance de uma tarefa de perguntas e respostas. Esse tipo de otimização seria praticamente impossível de fazer manualmente, segundo Chaudhry. A combinação de MIT e Microsoft por trás do projeto também é um sinal de que essa pesquisa tem tanto rigor acadêmico quanto aplicabilidade industrial. O estudo, aliás, será apresentado no USENIX Symposium on Operating Systems Design and Implementation.

Por que isso importa para o futuro dos agentes de IA

A conversa sobre sustentabilidade na inteligência artificial está ficando cada vez mais séria, e com razão. Os grandes modelos de linguagem já consomem volumes absurdos de energia só para existir, e quando você começa a escalar fluxos de trabalho agentic em produção, esse consumo cresce de uma forma que muitas empresas ainda não estão contabilizando direito. Como o próprio Chaudhry destaca, é muito fácil alocar recursos demais, desperdiçando energia e dinheiro, e permitir que um provedor de nuvem torne esses fluxos mais eficientes de forma inteligente é uma vitória para todos os envolvidos.

Receba o melhor conteúdo de inovação em seu e-mail

Todas as notícias, dicas, tendências e recursos que você procura entregues na sua caixa de entrada.

Ao assinar a newsletter, você concorda em receber comunicações da Método Viral. A gente se compromete a sempre proteger e respeitar sua privacidade.

A eficiência energética deixou de ser uma preocupação secundária e virou um critério real de decisão arquitetural, especialmente para empresas que têm metas de sustentabilidade ou que operam em mercados onde o custo de infraestrutura é determinante para a viabilidade do produto. Os fluxos agentic estão rapidamente se tornando a espinha dorsal do que os provedores de nuvem oferecem, e cuidar de quão eficientes eles são deixou de ser opcional.

Do ponto de vista técnico, o Murakkab representa uma mudança de paradigma importante na forma como pensamos a otimização de sistemas agentic. Até agora, a tendência era resolver problemas de performance jogando mais recurso no problema, usando modelos maiores, mais memória, mais paralelismo. O que essa pesquisa propõe é o caminho oposto: usar menos recurso de forma mais inteligente, deixando um sistema de orquestração tomar as decisões que um humano levaria muito tempo para tomar manualmente em escala. Isso tem implicações diretas não só para a eficiência operacional, mas também para a democratização do uso de agentes de IA, já que sistemas mais econômicos ficam acessíveis para equipes menores e com orçamentos mais limitados.

E tem um outro ângulo que vale destacar: a complexidade de gerenciar fluxos de trabalho agentic em produção é um dos maiores obstáculos para a adoção em escala dessas tecnologias hoje. Quanto mais o trabalho de otimização puder ser automatizado e abstraído para uma camada inteligente como o Murakkab, mais os desenvolvedores conseguem focar no que realmente importa, que é construir a lógica de negócio dos agentes em vez de gastar tempo gerenciando infraestrutura.

Os próximos passos da equipe envolvem expandir o sistema para fluxos de trabalho ainda mais complexos e clusters de computação maiores, explorando oportunidades de otimizar novas aplicações agentic. Como resume Chaudhry, existe muito potencial para tornar esses fluxos mais econômicos em recursos, de modo que consumam bem menos energia, mas é preciso pensar nisso na escala das grandes plataformas de nuvem. Essa pesquisa, apoiada em parte pela Semiconductor Research Corporation e pela DARPA, aponta para um caminho onde a computação em nuvem para IA se torna não só mais barata e sustentável, mas também mais simples de usar. E isso é o tipo de avanço que tem potencial real de mudar como a indústria constrói essas aplicações nos próximos anos. 🚀

Agentes AI: otimização e eficiência em nuvem

Índice

Como Implementar as Melhores Ferramentas de IA

O problema real por trás dos fluxos de trabalho agentic

Como o Murakkab funciona na prática

Os números que comprovam a eficiência

Por que isso importa para o futuro dos agentes de IA

Receba o melhor conteúdo de inovação em seu e-mail

Rafael

FALE
CONOSCO

Publicações relacionadas

Ações da Amazon podem subir com parceria OpenAI

Moratória em Datacenters de IA: Energia em Debate

Blockchain e Agentes de IA Mudam os Pagamentos em Cripto

Receba o melhor conteúdo de inovação em seu e-mail

INÍCIO

PRODUTOS

SERVIÇOS

RECURSOS

Rafael

Calculadora Preço de Sites

Páginas do Site

Recursos do Site

Visitantes por mês

Automação de Marketing

Qual o segmento do site?

Resultado da Calculadora

Confira alguns dos nossos trabalhos

Gestão de Marketing – Estratégia e Execução

Gestão de Marketing – Estratégia e Execução

Gestão de Marketing – Marketplace, Estratégia e Execução

Agentes AI: otimização e eficiência em nuvem

Índice

Como Implementar as Melhores Ferramentas de IA

O problema real por trás dos fluxos de trabalho agentic

Como o Murakkab funciona na prática

Os números que comprovam a eficiência

Por que isso importa para o futuro dos agentes de IA

Receba o melhor conteúdo de inovação em seu e-mail

Rafael

FALECONOSCO

Publicações relacionadas

Ações da Amazon podem subir com parceria OpenAI

Moratória em Datacenters de IA: Energia em Debate

Blockchain e Agentes de IA Mudam os Pagamentos em Cripto

Receba o melhor conteúdo de inovação em seu e-mail

Rafael

Calculadora Preço de Sites

Páginas do Site

Resultado da Calculadora

Confira alguns dos nossos trabalhos

Gestão de Marketing – Estratégia e Execução

Gestão de Marketing – Estratégia e Execução

Gestão de Marketing – Marketplace, Estratégia e Execução

Fale com um consultor

FALE
CONOSCO