IA: Agentes Isolados Reinventam a Infraestrutura em Nuvem

Agentes de IA estão redesenhando a internet e a nuvem precisa acompanhar

Agentes de inteligência artificial estão mudando tudo, e não estamos falando só dos modelos em si, mas da estrutura inteira que sustenta a internet. A forma como aplicações são construídas, escaladas e operadas está sendo fundamentalmente desafiada por um novo tipo de software que não segue nenhuma das regras que aprendemos nos últimos quinze anos de computação em nuvem.

A computação em nuvem que conhecemos hoje foi projetada para um mundo onde humanos acessam aplicações, e não para um cenário onde milhões de agentes autônomos executam tarefas simultaneamente, tomam decisões e consomem recursos de forma completamente diferente de qualquer usuário humano.

Foi exatamente para responder a esse novo cenário que a Cloudflare lançou a Agents Week, uma semana inteira dedicada a repensar a infraestrutura da internet para a era dos agentes. A missão da empresa sempre foi ajudar a construir uma internet melhor, e desta vez, isso significa construir para o que vem a seguir.

E o timing não poderia ser mais relevante.

A cada semana surgem novos agentes de código, assistentes autônomos e ferramentas que operam sem intervenção humana constante, enquanto a infraestrutura por baixo ainda tenta encaixar essa nova realidade em moldes que foram criados na era dos smartphones. A nuvem, como a conhecemos, nasceu da última grande mudança de paradigma tecnológico: o surgimento dos smartphones, que colocaram a internet no bolso de todo mundo e transformaram a natureza do que significava estar online.

Neste artigo, você vai entender por que essa mudança é tão profunda, quais são os desafios técnicos e econômicos envolvidos, e o que a Cloudflare está propondo como solução para tornar os agentes viáveis em escala global. 🚀

A internet e a nuvem não foram construídas para a era da IA

Quando os smartphones colocaram a internet no bolso de todos, eles não apenas adicionaram usuários. Eles mudaram a natureza do que significava estar online. Sempre conectado, sempre esperando uma resposta instantânea. As aplicações precisaram lidar com uma ordem de magnitude a mais de usuários, e a infraestrutura que as sustentava teve que evoluir para dar conta desse novo volume.

A abordagem que a indústria adotou foi direta: mais usuários, mais cópias da sua aplicação. Conforme as aplicações cresciam em complexidade, os times as dividiam em pedaços menores, os famosos microsserviços, para que cada equipe pudesse controlar seu próprio destino. Mas o princípio central permaneceu o mesmo: um número finito de aplicações, cada uma servindo muitos usuários. Escalar significava mais cópias.

Kubernetes e containers se tornaram o padrão. Eles facilitaram subir instâncias, distribuir carga e derrubar o que não era mais necessário. Nesse modelo de um-para-muitos, uma única instância podia servir muitos usuários, e mesmo que o número de usuários chegasse a bilhões, a quantidade de coisas que você precisava gerenciar continuava finita.

Os agentes quebram essa lógica por completo.

Um usuário, um agente, uma tarefa

Diferente de toda aplicação que veio antes deles, os agentes são um-para-um. Cada agente é uma instância única, servindo um usuário, executando uma tarefa. Enquanto uma aplicação tradicional segue o mesmo caminho de execução independentemente de quem está usando, um agente exige seu próprio ambiente de execução: um onde o modelo de linguagem dita o caminho do código, chama ferramentas de forma dinâmica, ajusta sua abordagem e persiste até que a tarefa esteja concluída.

Pense na diferença entre um restaurante e um chef pessoal. Um restaurante tem um cardápio, um conjunto fixo de opções, e uma cozinha otimizada para produzi-las em volume. Isso é a maioria das aplicações hoje. Um agente é mais como um chef pessoal que pergunta: o que você quer comer? Ele pode precisar de ingredientes, utensílios ou técnicas completamente diferentes a cada vez. Não dá para operar um serviço de chef pessoal com a mesma estrutura de cozinha que você usaria para um restaurante.

No último ano, vimos os agentes decolarem, com os agentes de código liderando o caminho, o que não surpreende, já que desenvolvedores tendem a ser os primeiros a adotar novas tecnologias. A forma como a maioria dos agentes de código funciona hoje é subindo um container para dar ao modelo de linguagem o que ele precisa: um sistema de arquivos, git, bash e a capacidade de rodar binários arbitrários.

Mas agentes de código são apenas o começo. Ferramentas como o Claude Cowork já estão tornando os agentes acessíveis para usuários menos técnicos. Quando os agentes saírem das mãos dos desenvolvedores e chegarem às mãos de todo mundo — assistentes administrativos, analistas de pesquisa, atendentes de suporte, organizadores pessoais — a matemática de escala fica assustadora bem rápido. 🤯

A matemática de escalar agentes para as massas

Se os mais de 100 milhões de trabalhadores do conhecimento nos Estados Unidos usassem cada um um assistente agêntico com cerca de 15% de concorrência, você precisaria de capacidade para aproximadamente 24 milhões de sessões simultâneas. Com 25 a 50 usuários por CPU, isso dá algo entre 500 mil e 1 milhão de CPUs de servidor — só para os EUA, com um agente por pessoa.

Como Implementar as Melhores Ferramentas de IA

Um guia prático para avaliar, comparar e implementar inteligência artificial com clareza — sem desperdício de tempo ou dinheiro.

Pare de contratar ferramentas sem direção. Criamos um método estruturado para decidir qual IA realmente faz sentido para o seu negócio.

Entrega em PDF no seu e-mail · Sem spam · LGPD

🔒 Seus dados são protegidos conforme a LGPD. Você pode descadastrar a qualquer momento.

Agora imagine cada pessoa rodando vários agentes em paralelo. Agora imagine o resto do mundo, com mais de 1 bilhão de trabalhadores do conhecimento. Não estamos um pouco longe de ter computação suficiente. Estamos ordens de magnitude longe.

Então como fechar essa lacuna?

Infraestrutura construída para agentes

Oito anos atrás, a Cloudflare lançou o Workers, o início da sua plataforma de desenvolvimento e uma aposta em computação serverless sem containers. A motivação na época era prática: a empresa precisava de computação leve sem cold-starts para clientes que dependiam da Cloudflare por velocidade. Construído sobre isolates V8 em vez de containers, o Workers se mostrou uma ordem de magnitude mais eficiente — mais rápido para iniciar, mais barato para rodar, e nativamente adequado para o padrão de subir, executar e derrubar.

O que a Cloudflare não antecipou foi o quão bem esse modelo se encaixaria na era dos agentes.

Onde containers dão a cada agente uma cozinha comercial completa — com eletrodomésticos fixos, câmaras frias e tudo mais, precisando o agente ou não — os isolates, por outro lado, dão ao chef pessoal exatamente o espaço de bancada, o queimador e a faca que ele precisa para aquela refeição específica. Provisionados em milissegundos. Limpos no momento em que o prato é servido.

Em um mundo onde precisamos suportar não milhares de aplicações de longa duração, mas bilhões de ambientes de execução efêmeros e de propósito único, os isolates são a primitiva certa. Cada um inicia em milissegundos. Cada um é isolado de forma segura. E você pode rodar ordens de magnitude a mais deles no mesmo hardware comparado a containers.

Poucas semanas antes da Agents Week, a Cloudflare levou isso adiante com o Dynamic Workers em open beta: ambientes de execução criados em tempo de execução, sob demanda. Um isolate leva poucos milissegundos para iniciar e usa poucos megabytes de memória. Isso é aproximadamente 100x mais rápido e até 100x mais eficiente em memória do que um container.

Você pode iniciar um novo para cada requisição, rodar um trecho de código e descartá-lo — em uma escala de milhões por segundo.

Para que os agentes saiam dos early adopters e cheguem às mãos de todos, eles também precisam ser acessíveis financeiramente. Rodar cada agente em seu próprio container é caro o suficiente para que as ferramentas agênticas de hoje estejam majoritariamente limitadas a assistentes de código para engenheiros que conseguem justificar o custo. Os isolates, ao rodarem ordens de magnitude mais eficientemente, são o que torna a economia unitária viável na escala que os agentes exigem. 💡

A fase da carruagem sem cavalos

Embora seja fundamental construir a base certa para o futuro, ainda não chegamos lá. E toda mudança de paradigma tem um período onde tentamos fazer a coisa nova funcionar dentro do modelo antigo. Os primeiros carros eram chamados de carruagens sem cavalos. Os primeiros sites eram folhetos digitais. Os primeiros aplicativos móveis eram interfaces de desktop encolhidas. Estamos nessa fase agora com os agentes.

Dá pra ver isso em todo lugar.

Estamos dando a agentes navegadores headless para navegar em sites desenhados para olhos humanos, quando o que eles precisam são protocolos estruturados como o MCP para descobrir e invocar serviços diretamente. Muitos servidores MCP iniciais são wrappers finos em torno de APIs REST existentes — mesmas operações CRUD, novo protocolo — quando os modelos de linguagem são, na verdade, muito melhores em escrever código do que em fazer chamadas sequenciais de ferramentas.

Estamos usando CAPTCHAs e fingerprinting comportamental para verificar quem está do outro lado de uma requisição, quando cada vez mais essa entidade é um agente agindo em nome de alguém — e a pergunta certa não é você é humano? mas sim qual agente é você, quem te autorizou e o que você tem permissão para fazer?

Estamos subindo containers completos para agentes que precisam apenas fazer algumas chamadas de API e retornar um resultado.

Nada disso é surpreendente. É assim que transições funcionam.

Construindo para os dois mundos ao mesmo tempo

A internet está sempre em algum lugar entre duas eras. O IPv6 é objetivamente melhor que o IPv4, mas abandonar o suporte ao IPv4 quebraria metade da internet. HTTP/2 e HTTP/3 coexistem. O TLS 1.2 ainda não cedeu completamente para o 1.3. A tecnologia melhor existe, a tecnologia antiga persiste, e o trabalho da infraestrutura é fazer a ponte entre ambas.

A Cloudflare sempre esteve no negócio de fazer essa ponte durante transições. A mudança para agentes não é diferente.

Agentes de código genuinamente precisam de containers — um sistema de arquivos, git, bash, execução de binários arbitrários. Isso não vai embora. Durante a Agents Week, os ambientes sandbox baseados em containers da Cloudflare entraram em disponibilidade geral (GA), porque a empresa está comprometida em torná-los os melhores possíveis. Eles também estão aprofundando a renderização de navegador para agentes, porque haverá uma longa cauda de serviços que ainda não falam MCP, e os agentes ainda precisarão interagir com eles.

Mas a empresa também está construindo o que vem a seguir: os isolates, os protocolos e os modelos de identidade que os agentes realmente precisam. O trabalho é garantir que ninguém precise escolher entre o que funciona hoje e o que é certo para amanhã.

Segurança no modelo, não ao redor dele

Se os agentes vão lidar com nossas tarefas profissionais e pessoais — ler nossos emails, operar em nosso código, interagir com nossos serviços financeiros — então a segurança precisa estar embutida no modelo de execução, não adicionada como camada depois.

Os CISOs foram os primeiros a confrontar isso. Os ganhos de produtividade de colocar agentes nas mãos de todos são reais, mas hoje a maioria das implantações de agentes está cheia de riscos: injeção de prompt, exfiltração de dados, acesso não autorizado a APIs, uso opaco de ferramentas.

Um agente de vibe-coding de um desenvolvedor precisa de acesso a repositórios e pipelines de deploy. Um agente de atendimento ao cliente de uma empresa precisa de acesso a APIs internas e dados de usuários. Em ambos os casos, proteger o ambiente hoje significa costurar credenciais, políticas de rede e controles de acesso que nunca foram desenhados para software autônomo.

A Cloudflare vem construindo duas plataformas em paralelo: sua plataforma de desenvolvimento, para pessoas que constroem aplicações, e sua plataforma zero trust, para organizações que precisam proteger acessos. Por um tempo, essas plataformas serviam públicos distintos. Mas as perguntas como eu construo esse agente? e como eu garanto que ele é seguro? estão se tornando cada vez mais a mesma pergunta. A empresa está unindo essas plataformas para que tudo isso seja nativo à forma como os agentes rodam, não uma camada separada que você aparafusa depois. 🔐

Agentes que seguem as regras

Existe outra dimensão da era dos agentes que vai além de computação e segurança: economia e governança.

Quando agentes interagem com a internet em nosso nome — lendo artigos, consumindo APIs, acessando serviços — precisa existir uma forma para que as pessoas e organizações que criam esse conteúdo e operam esses serviços definam termos e sejam remuneradas. Hoje, o modelo econômico da web é construído em torno da atenção humana: anúncios, paywalls, assinaturas.

Agentes não têm atenção no sentido humano. Eles não veem anúncios. Não clicam em banners de cookies.

Se queremos uma internet onde agentes possam operar livremente e onde editores, criadores de conteúdo e provedores de serviço sejam justamente compensados, precisamos de nova infraestrutura para isso. A Cloudflare está construindo ferramentas que facilitam para editores e proprietários de conteúdo definir e aplicar políticas sobre como os agentes interagem com seu material.

No ano passado, ao lado da Coinbase, a Cloudflare cofundou a x402 Foundation, um padrão aberto e neutro que revive o código de status HTTP 402, há muito tempo adormecido, para dar aos agentes uma forma nativa de pagar pelos serviços e conteúdos que consomem. Identidade de agente, autorização, pagamento e segurança: tudo isso precisa de padrões abertos que nenhuma empresa pode definir sozinha.

Construir uma internet melhor sempre significou garantir que ela funcione para todos — não apenas para quem constrói a tecnologia, mas para as pessoas cujo trabalho e criatividade tornam a internet algo que vale a pena usar. Isso não muda na era dos agentes. Torna-se ainda mais importante. 🌍

Receba o melhor conteúdo de inovação em seu e-mail

Todas as notícias, dicas, tendências e recursos que você procura entregues na sua caixa de entrada.

Ao assinar a newsletter, você concorda em receber comunicações da Método Viral. A gente se compromete a sempre proteger e respeitar sua privacidade.

O custo real de rodar agentes em produção

Existe uma conversa que acontece muito nos bastidores do desenvolvimento de produtos com inteligência artificial e que raramente aparece nos comunicados oficiais: o custo de operação de agentes em produção pode ser surpreendentemente alto quando a infraestrutura não foi pensada para esse tipo de workload. Não é incomum ver times de engenharia surpresos com faturas de nuvem muito maiores do que o esperado depois de colocar seus primeiros agentes em operação real, mesmo com volumes de uso relativamente modestos.

O problema tem várias camadas. A primeira é o tempo de execução: agentes que fazem raciocínio encadeado, consultam múltiplas fontes e tomam decisões complexas podem rodar por minutos em vez de milissegundos, o que inverte completamente a lógica de precificação das funções serverless tradicionais, que foram otimizadas para execuções curtíssimas. A segunda camada é o tráfego de dados: agentes que acessam bases de conhecimento, chamam APIs externas e se comunicam com outros agentes geram um volume de transferência de dados muito maior do que uma aplicação web convencional para o mesmo número de usuários finais.

A proposta da Cloudflare para esse problema passa por um modelo de execução baseado em isolates, que são dramaticamente mais baratos de operar porque consomem apenas os recursos estritamente necessários para cada tarefa. Os períodos de hibernação de um Durable Object, por exemplo, não consomem recursos computacionais ativos, o que representa uma economia significativa para agentes que passam grande parte do tempo esperando respostas de APIs de terceiros, modelos de linguagem externos ou ações humanas dentro de um fluxo de trabalho híbrido. 💰

Uma plataforma para desenvolvedores e agentes

A visão da Cloudflare para sua plataforma de desenvolvimento sempre foi oferecer uma plataforma completa que simplesmente funcione: do experimento ao MVP, passando pela escala para milhões de usuários. Mas fornecer as primitivas é só parte da equação. Uma grande plataforma também precisa pensar em como tudo funciona junto e como se integra ao fluxo de desenvolvimento.

Esse trabalho está evoluindo. Antes era puramente sobre experiência do desenvolvedor, facilitando para humanos construir, testar e publicar. Cada vez mais, é também sobre ajudar agentes a ajudar humanos, e fazer a plataforma funcionar não apenas para as pessoas construindo agentes, mas para os próprios agentes. Um agente consegue encontrar as melhores práticas mais atualizadas? Quão facilmente ele consegue descobrir e invocar as ferramentas e CLIs necessárias? Quão fluida é a transição de escrever código para deployar?

Durante a Agents Week, a Cloudflare está entregando melhorias em ambas as dimensões — tornando a plataforma melhor para os humanos que constroem sobre ela e para os agentes que rodam nela.

Construir o futuro é trabalho em equipe

Construir o futuro não é algo que se faz sozinho. Toda grande transição da internet — de HTTP/1.1 para HTTP/2 e HTTP/3, de TLS 1.2 para 1.3 — exigiu que a indústria convergisse em padrões compartilhados. A mudança para agentes não será diferente.

A Cloudflare tem um longo histórico de contribuir e ajudar a empurrar os padrões que fazem a internet funcionar. A empresa está envolvida com o IETF há mais de uma década, ajudando a desenvolver e implantar protocolos como QUIC, TLS 1.3 e Encrypted Client Hello. Foi membro fundador do WinterTC, o comitê técnico da ECMA para interoperabilidade de runtimes JavaScript. E disponibilizou o runtime do Workers como código aberto.

A empresa está trazendo a mesma abordagem para a era agêntica. Faz parte da Linux Foundation e da AAIF, e está ajudando a apoiar e avançar padrões como o MCP que serão fundamentais para o futuro dos agentes. Desde que a Anthropic introduziu o MCP, a Cloudflare trabalhou de perto com eles para construir a infraestrutura para servidores MCP remotos, disponibilizou suas próprias implementações como código aberto e investiu em tornar o protocolo prático em escala.

O que muda para quem está desenvolvendo com IA agora

Se você está construindo algo com agentes de inteligência artificial hoje, seja um assistente autônomo, um pipeline de automação ou uma ferramenta que combina múltiplos modelos, a mensagem principal da Agents Week é que a infraestrutura disponível está finalmente começando a se alinhar com as necessidades reais desses sistemas. Isso não significa que os problemas foram resolvidos de uma vez, mas significa que existem agora primitivas mais adequadas para trabalhar, em vez de tentar adaptar soluções que foram criadas com outro propósito em mente.

A adoção do protocolo MCP como padrão de comunicação entre agentes e ferramentas é particularmente relevante porque reduz a fragmentação do ecossistema. Quando cada ferramenta tem sua própria forma de ser acessada por um agente, o resultado é um código de integração frágil, difícil de manter e cheio de casos especiais. Um padrão aberto muda isso, e a Cloudflare, ao adotar o MCP nativamente em sua plataforma, sinaliza que está apostando na consolidação desse ecossistema em vez de tentar criar um padrão proprietário que trave os desenvolvedores dentro de sua própria infraestrutura.

A computação em nuvem está, na prática, passando por uma reformulação conceitual profunda. O modelo de requisição e resposta que dominou a última década e meia está cedendo espaço para um modelo baseado em agentes que persistem, raciocinam e agem de forma contínua. E a infraestrutura que vai suportar esse novo modelo precisa ser pensada desde o início para esse propósito, com isolamento real, execução eficiente e custo proporcional ao uso real.

A internet não foi construída para IA. A nuvem não foi construída para agentes. Mas a Cloudflare sempre foi sobre ajudar a construir uma internet melhor — e o que melhor significa muda a cada era. Esta é a era dos agentes, e a Agents Week é uma aposta clara de que esse futuro chegou mais cedo do que muita gente esperava. 🌐

IA: Agentes Isolados Reinventam a Infraestrutura em Nuvem

Índice

Agentes de IA estão redesenhando a internet e a nuvem precisa acompanhar

A internet e a nuvem não foram construídas para a era da IA

Um usuário, um agente, uma tarefa

A matemática de escalar agentes para as massas

Como Implementar as Melhores Ferramentas de IA

Infraestrutura construída para agentes

A fase da carruagem sem cavalos

Construindo para os dois mundos ao mesmo tempo

Segurança no modelo, não ao redor dele

Agentes que seguem as regras

Receba o melhor conteúdo de inovação em seu e-mail

O custo real de rodar agentes em produção

Uma plataforma para desenvolvedores e agentes

Construir o futuro é trabalho em equipe

O que muda para quem está desenvolvendo com IA agora

Rafael

FALE
CONOSCO

Publicações relacionadas

Ações da Amazon podem subir com parceria OpenAI

Moratória em Datacenters de IA: Energia em Debate

Blockchain e Agentes de IA Mudam os Pagamentos em Cripto

Receba o melhor conteúdo de inovação em seu e-mail

INÍCIO

PRODUTOS

SERVIÇOS

RECURSOS

Rafael

Calculadora Preço de Sites

Páginas do Site

Recursos do Site

Visitantes por mês

Automação de Marketing

Qual o segmento do site?

Resultado da Calculadora

Confira alguns dos nossos trabalhos

Gestão de Marketing – Estratégia e Execução

Gestão de Marketing – Estratégia e Execução

Gestão de Marketing – Marketplace, Estratégia e Execução

IA: Agentes Isolados Reinventam a Infraestrutura em Nuvem

Índice

Agentes de IA estão redesenhando a internet e a nuvem precisa acompanhar

A internet e a nuvem não foram construídas para a era da IA

Um usuário, um agente, uma tarefa

A matemática de escalar agentes para as massas

Como Implementar as Melhores Ferramentas de IA

Infraestrutura construída para agentes

A fase da carruagem sem cavalos

Construindo para os dois mundos ao mesmo tempo

Segurança no modelo, não ao redor dele

Agentes que seguem as regras

Receba o melhor conteúdo de inovação em seu e-mail

O custo real de rodar agentes em produção

Uma plataforma para desenvolvedores e agentes

Construir o futuro é trabalho em equipe

O que muda para quem está desenvolvendo com IA agora

Rafael

FALECONOSCO

Publicações relacionadas

Ações da Amazon podem subir com parceria OpenAI

Moratória em Datacenters de IA: Energia em Debate

Blockchain e Agentes de IA Mudam os Pagamentos em Cripto

Receba o melhor conteúdo de inovação em seu e-mail

Rafael

Calculadora Preço de Sites

Páginas do Site

Resultado da Calculadora

Confira alguns dos nossos trabalhos

Gestão de Marketing – Estratégia e Execução

Gestão de Marketing – Estratégia e Execução

Gestão de Marketing – Marketplace, Estratégia e Execução

Fale com um consultor

FALE
CONOSCO