Arm lança seu próprio chip e entra de cabeça na corrida pela infraestrutura de IA
A infraestrutura de inteligência artificial está passando por uma das maiores transformações da sua história, e a Arm acaba de soltar uma bomba no mercado.
Depois de mais de 35 anos focada em licenciar sua tecnologia para outros fabricantes, a empresa deu um passo que poucos esperavam: lançou seu próprio chip de silício, pronto para produção e voltado para datacenters.
O Arm AGI CPU não é só mais um processador no mercado — ele foi criado do zero para atender às demandas de uma nova era da IA, onde agentes de software operam de forma contínua, em escala global, sem que um humano precise estar no meio do caminho para tudo funcionar.
E quando falamos em desempenho, os números impressionam:
- Até 8.160 cores por rack na configuração padrão com resfriamento a ar
- Mais de 45.000 cores por rack na versão com resfriamento líquido, em parceria com a Supermicro
- Mais de 2x de desempenho por rack em comparação com os sistemas x86 mais recentes
Mas o que realmente chama atenção aqui não é só a performance técnica.
É o momento em que esse chip chega — e quem já está do lado da Arm nessa empreitada.
Meta, OpenAI, Cloudflare, Cerebras, SAP, SK Telecom e mais uma série de grandes nomes do ecossistema de IA já estão embarcados nessa jornada. A Meta, inclusive, é a parceira principal e participou do co-desenvolvimento do chip.
Vamos entender o que torna o Arm AGI CPU tão relevante para o futuro da computação em nuvem e da infraestrutura de IA em larga escala. 🚀
Por que a Arm decidiu criar seu próprio chip agora?
Durante décadas, o modelo de negócio da Arm funcionou de um jeito muito específico: a empresa desenvolvia arquiteturas de processadores e licenciava essa tecnologia para outros fabricantes, como Qualcomm, Apple, Samsung e uma lista enorme de parceiros ao redor do mundo. Esse modelo gerou bilhões em receita e colocou a Arm no coração de praticamente todos os smartphones do planeta. Mas o mercado mudou — e a velocidade com que a inteligência artificial está evoluindo trouxe uma pressão que nenhuma empresa de tecnologia consegue ignorar.
O problema é que o ciclo tradicional de desenvolvimento de chips, onde a Arm cria a arquitetura, licencia para um parceiro, o parceiro produz e coloca no mercado, leva tempo. Tempo que, no ritmo atual da corrida pela IA, pode significar ficar para trás. Com o Arm AGI CPU, a empresa cortou esse ciclo e passou a entregar diretamente silício pronto para produção — construído sobre a plataforma Arm Neoverse, a mesma base que já sustenta soluções como AWS Graviton, Google Axion, Microsoft Azure Cobalt e NVIDIA Vera. A novidade é que, pela primeira vez, a Arm não está apenas fornecendo o projeto — está entregando o produto final.
Essa mudança não é uma virada de chave pequena. É uma redefinição completa do papel da Arm no ecossistema global de tecnologia. A empresa agora oferece aos seus clientes três opções: construir silício customizado a partir da arquitetura Arm, integrar subsistemas de nível de plataforma como os Arm Compute Subsystems, ou simplesmente adotar processadores projetados e produzidos pela própria Arm. Mais escolha, mais flexibilidade, mais velocidade para quem precisa escalar infraestrutura de IA.
Além disso, tem um contexto maior aqui que vale entender. O mercado de infraestrutura para IA está crescendo em ritmo absurdo, e os datacenters do mundo inteiro estão sendo redesenhados para suportar modelos de linguagem cada vez maiores, agentes autônomos e sistemas de raciocínio em tempo real. A Arm identificou que existe um gap real entre o que os processadores x86 tradicionais entregam e o que as novas cargas de trabalho de IA precisam — especialmente em termos de eficiência energética, paralelismo e capacidade de escalar horizontalmente sem explosão de custo. O AGI CPU foi construído exatamente para preencher esse espaço. 💡
A era da IA agêntica e o papel central da CPU
Existe um conceito importante por trás da criação do Arm AGI CPU que precisa ficar claro: a ascensão da IA agêntica. Historicamente, o gargalo da computação sempre foi o ser humano. A velocidade com que as pessoas conseguiam interagir com os sistemas é que definia o ritmo de trabalho. Mas na era dos agentes de IA, essa limitação desaparece. Agentes de software coordenam tarefas, interagem com múltiplos modelos e tomam decisões em tempo real, sem pausas, sem intervalos, sem depender de alguém clicar em um botão.
Quando sistemas de IA passam a operar de forma contínua e as cargas de trabalho crescem em complexidade, a CPU se torna o elemento que dita o ritmo de toda a infraestrutura moderna. Em um datacenter moderno de IA, o processador gerencia milhares de tarefas distribuídas — orquestrando aceleradores, administrando memória e armazenamento, agendando workloads, movendo dados entre sistemas e, agora com a IA agêntica, coordenando o fan-out entre um número enorme de agentes simultâneos.
Essa mudança coloca demandas completamente novas sobre a CPU. Não basta ter mais clock ou mais cores — é preciso uma evolução fundamental no processador, algo que foi pensado desde o início para esse novo paradigma. E é exatamente aí que o Arm AGI CPU entra na história.
O que faz o Arm AGI CPU diferente de tudo que existe hoje
Quando a Arm fala em mais de 45.000 cores por rack na versão com resfriamento líquido, isso não é só um número bonito para slide de apresentação. Estamos falando de uma densidade de computação que muda completamente a lógica de como datacenters são projetados.
Vamos aos detalhes técnicos. A configuração de referência do servidor Arm é um design 1OU com 2 nós, onde cada blade comporta dois chips com memória dedicada e I/O, totalizando 272 cores por blade. Essas blades foram projetadas para preencher completamente um rack padrão com resfriamento a ar de 36kW — são 30 blades entregando um total de 8.160 cores. Já na versão com resfriamento líquido de 200kW, desenvolvida em parceria com a Supermicro, o rack acomoda 336 unidades do Arm AGI CPU, ultrapassando 45.000 cores.
Nessa configuração, o Arm AGI CPU entrega mais de 2x o desempenho por rack em comparação com os sistemas x86 mais recentes. Esse ganho vem de três vantagens fundamentais da arquitetura:
- Largura de banda de memória líder da categoria: isso se traduz em mais threads de execução efetivas por rack. Nos CPUs x86, o desempenho degrada à medida que os cores disputam recursos sob carga sustentada.
- Cores Arm Neoverse V3 de alto desempenho e eficientes em single-thread: cada thread Arm realiza mais trabalho do que as arquiteturas legadas.
- Efeito composto: mais threads utilizáveis somadas a mais trabalho por thread resultam em ganhos massivos de desempenho por rack.
A filosofia de design aqui é fundamentalmente diferente do que vimos nos últimos anos com os chips x86. Em vez de tentar adaptar uma arquitetura existente para IA — com adição de instruções específicas e aceleradores embutidos — a equipe da Arm partiu do conceito de que cada elemento do processador, desde a frequência de operação até a arquitetura de memória e I/O, precisava ser otimizado para cargas de trabalho massivamente paralelas e de alta performance em implantações de rack densamente populadas.
A escalabilidade nativa da arquitetura é outro diferencial importante. Em sistemas tradicionais, escalar significa adicionar mais máquinas, mais racks, mais cabos, mais complexidade de rede — e tudo isso se traduz em latência adicional e custo operacional crescente. O AGI CPU foi concebido para que múltiplos chips trabalhem de forma coesa, permitindo que provedores de nuvem construam infraestruturas muito mais eficientes sem precisar multiplicar a complexidade de gerenciamento na mesma proporção. 🔥
Quem já está apostando no Arm AGI CPU
Meta, OpenAI e Cloudflare não são nomes que costumam entrar em parcerias sem uma análise técnica e estratégica muito cuidadosa. O fato de essas três empresas, que têm perfis de uso de infraestrutura completamente diferentes entre si, já estarem embarcadas no ecossistema do Arm AGI CPU diz muito sobre o potencial do chip.
A Meta é a parceira principal e co-desenvolveu o Arm AGI CPU para otimizar infraestrutura na escala de gigawatts para a família de apps da Meta, trabalhando em conjunto com os aceleradores customizados MTIA da própria empresa. Santosh Janardhan, Head de Infraestrutura da Meta, destacou que a plataforma melhora significativamente a densidade de desempenho dos datacenters e oferece um roadmap multi-geracional para os sistemas de IA em evolução da companhia.
A OpenAI está no centro da corrida pelos modelos de linguagem mais avançados e precisa de infraestrutura que suporte inferência em altíssimo volume. Sachin Katti, Head de Computação Industrial na OpenAI, confirmou que o Arm AGI CPU terá um papel importante na infraestrutura da empresa, fortalecendo a camada de orquestração que coordena workloads de IA em larga escala e melhorando eficiência, desempenho e largura de banda.
Já a Cloudflare tem um modelo de negócio baseado em distribuição de computação na borda da rede, onde eficiência e latência são tudo. Stephanie Cohen, Chief Strategy Officer da Cloudflare, apontou que o chip oferece computação de alto desempenho e eficiente em energia, projetada para a próxima geração de workloads.
A lista de parceiros de lançamento vai além: Cerebras, F5, Positron, Rebellions, SAP e SK Telecom também estão trabalhando com a Arm na implantação do chip para acelerar serviços de IA em ambientes de nuvem, rede e empresariais. Sistemas comerciais já estão disponíveis para pedido junto à ASRockRack, Lenovo e Supermicro.
Cada um desses players resolve um problema diferente com o mesmo chip — e isso é exatamente o que valida a abordagem da Arm. Um processador que serve bem para rodar agentes de IA na borda da rede da Cloudflare e ao mesmo tempo escala para as demandas de inferência da OpenAI precisa ser muito versátil, muito eficiente e muito bem projetado. O desempenho consistente em cenários tão diferentes não é algo que se consegue com uma arquitetura genérica — é resultado de decisões de design muito específicas e de uma compreensão profunda de como a nova geração de inteligência artificial funciona na prática.
Para o mercado de infraestrutura como um todo, o sinal que esses parceiros enviam é poderoso. Mais de 50 empresas líderes em hiperescala, nuvem, silício, memória, redes, software, design de sistemas e manufatura estão apoiando a expansão da plataforma de computação Arm para o mundo do silício. Quando as empresas que mais entendem de IA no mundo escolhem um chip, isso influencia toda a cadeia — de provedores de nuvem a startups que constroem sobre essas plataformas. 🤝
Servidor de referência e contribuições para o ecossistema aberto
Para acelerar ainda mais a adoção, a Arm está introduzindo o Arm AGI CPU 1OU Dual Node Reference Server, um servidor no formato padrão DC-MHS do Open Compute Project. Isso não é um detalhe menor — significa que a Arm está alinhando seu hardware com padrões abertos que a indústria já conhece e utiliza.
A empresa planeja contribuir com o design desse servidor de referência e o firmware de suporte, além de especificações de arquitetura de sistema, frameworks de depuração e ferramentas de diagnóstico e verificação que podem ser aplicadas a todos os sistemas baseados em Arm. Mais detalhes devem ser revelados no próximo OCP EMEA Summit.
Essa abordagem de código aberto para o hardware é estratégica. Quanto mais fácil for para fabricantes e provedores de nuvem adotarem o Arm AGI CPU, mais rápido o ecossistema de software e ferramentas ao redor dele se desenvolve — e esse ecossistema, muitas vezes, vale tanto quanto o chip em si.
O que isso significa para a infraestrutura de IA nos próximos anos
A chegada do Arm AGI CPU no mercado não vai mudar tudo da noite para o dia — nenhuma transição de infraestrutura acontece assim. Mas ela marca o início de uma mudança de direção que vai se tornar cada vez mais evidente ao longo dos próximos anos. O domínio da arquitetura x86 em servidores e datacenters durou décadas, e por boas razões: o ecossistema de software é enorme, os engenheiros estão familiarizados com a plataforma, e a performance bruta foi crescendo de forma consistente. Mas a IA criou uma nova métrica de sucesso para infraestrutura — e nessa nova métrica, eficiência energética, densidade de cores e capacidade de escalar cargas de trabalho de inferência e raciocínio passam a pesar muito mais do que simplesmente ter o clock mais alto.
Para os provedores de nuvem, a equação é direta: mais desempenho por watt e mais cores por rack significa que eles podem oferecer mais capacidade de computação para IA sem precisar construir datacenters proporcionalmente maiores ou pagar contas de energia proporcionalmente maiores. Num setor onde os custos operacionais são enormes e a pressão por margens é constante, esse tipo de ganho de eficiência se traduz diretamente em vantagem competitiva.
Vale lembrar que o Arm AGI CPU é apenas o primeiro produto da nova linha de silício para datacenters da Arm. Produtos subsequentes já estão comprometidos, mirando o melhor desempenho, escala e eficiência da categoria. Esse desenvolvimento acontece em paralelo com o roadmap dos Arm Neoverse CSS, garantindo que todos os clientes de datacenter da Arm avancem juntos em termos de arquitetura de plataforma e compatibilidade de software.
E para quem consome esses serviços — seja uma startup construindo um produto baseado em IA, seja uma empresa grande integrando agentes autônomos nos seus processos — o impacto mais visível deve ser sentido em termos de velocidade e disponibilidade. Infraestruturas mais eficientes e mais densas permitem que modelos respondam mais rápido, que mais usuários sejam atendidos simultaneamente e que novos casos de uso, que hoje são proibitivos pelo custo de computação, se tornem viáveis.
O Arm AGI CPU é, nesse sentido, um habilitador — uma peça de infraestrutura que abre portas para o próximo capítulo da inteligência artificial em escala global. A Arm não está apenas definindo a arquitetura do datacenter nativo de IA — está construindo essa arquitetura. E com mais de 50 parceiros estratégicos e os maiores nomes da indústria ao seu lado, os próximos capítulos dessa história prometem ser ainda mais interessantes. 🌐
