Agentic AI cresce em ritmo acelerado, e as vulnerabilidades acompanham o mesmo passo
A Agentic AI chegou para mudar o jogo, e chegou rápido demais.
Enquanto a IA tradicional fica esperando você digitar algo para só então reagir, os agentes autônomos de nova geração operam em outro nível: tomam decisões, perseguem objetivos e só acionam um humano quando realmente precisam.
Parece incrível, e é.
Mas essa autonomia toda tem um preço que a indústria ainda está aprendendo a pagar.
Segundo a Deloitte, cerca de 25% das organizações já estão explorando ou testando agentes autônomos de IA. Isso representa uma virada real no modo como empresas lidam com automação inteligente, saindo do modelo tradicional de IA generativa baseada em prompts para sistemas que agem por conta própria. O problema é que a adoção acelerada trouxe consigo um crescimento igualmente acelerado nas vulnerabilidades desses sistemas, e o ecossistema de segurança ainda não está preparado para lidar com essa nova realidade. 🚨
Só em 2026, aproximadamente 15.000 falhas de segurança já foram divulgadas publicamente por meio do sistema de Common Vulnerabilities and Exposures (CVE). Dessas, dezenas impactam diretamente sistemas de IA ou código gerado por IA. A weaponização e a exploração de sistemas de inteligência artificial ficaram especialmente visíveis no final de 2025, e a tendência só acelerou desde então. O caso OpenClaw virou o exemplo mais emblemático de como popularidade e risco podem caminhar lado a lado quando ninguém está prestando atenção nos detalhes.
O que torna a Agentic AI diferente, e mais arriscada
A diferença entre um chatbot comum e um agente autônomo de IA vai muito além da interface. Enquanto modelos tradicionais respondem a prompts isolados e dependem de um humano para encadear as ações, a Agentic AI foi construída para agir de forma contínua, coordenar tarefas complexas, acessar ferramentas externas, executar código, navegar em sistemas e tomar decisões sem aprovação humana a cada passo.
Esses agentes combinam painéis de controle de interface, integrações de mensageria, automação de navegador, ferramentas SSH, execução em containers, acesso ao sistema de arquivos e um LLM coordenando tudo isso. Em outras palavras, eles tocam praticamente todas as camadas de um sistema. Um token vazado ou um pacote falsificado podem rapidamente escalar para um comprometimento completo em nível de operador.
Isso muda tudo quando o assunto é cibersegurança, porque a superfície de ataque deixa de ser um ponto fixo e passa a ser um alvo em movimento constante. As permissões amplas que esses agentes possuem os tornam alvos extremamente atrativos para atacantes.
Quando um agente autônomo tem permissão para acessar APIs, bancos de dados, arquivos e até outros agentes dentro de uma cadeia de automação, qualquer falha em um único elo pode comprometer todo o sistema. E o pior: muitas vezes essa falha não aciona nenhum alerta imediato, porque o comportamento do agente, do ponto de vista superficial, continua parecendo normal. É exatamente aí que os ataques mais sofisticados conseguem operar sem levantar suspeitas por horas, às vezes dias inteiros.
O modelo de confiança que sustenta os sistemas tradicionais simplesmente não foi projetado para esse cenário. Frameworks de segurança clássicos assumem que há um humano revisando e aprovando cada ação crítica. Com agentes autônomos, essa suposição vai por água abaixo. As organizações que estão adotando Agentic AI em ambientes de produção sem revisar seus modelos de governança e controle de acesso estão, basicamente, entregando as chaves do castelo para um sistema que ninguém sabe exatamente como vai se comportar diante de um input malicioso bem construído.
OpenClaw: o caso que acendeu o sinal de alerta
O OpenClaw, anteriormente conhecido como ClawdBot ou MoltBot, é um agente de IA autônomo e auto-hospedado, capaz de navegar na web, gerenciar arquivos, ler, escrever e executar código localmente. Ele roda diretamente na máquina do usuário e pode encadear múltiplas habilidades para completar tarefas complexas. Por ser open source, é altamente personalizável e acessível a qualquer pessoa.
O OpenClaw não apenas ganhou tração, ele simplesmente explodiu. Poucas semanas após o lançamento, tornou-se o repositório com mais estrelas no GitHub, atraindo uma comunidade massiva de desenvolvedores e atenção imediata de pesquisadores de segurança.
Mas junto com essa popularidade veio o escrutínio. Muitos usuários não compreendem completamente as implicações de segurança e privacidade de rodar um sistema com esse nível de autonomia e acesso na própria máquina. Pesquisadores de segurança alertaram que o OpenClaw apresenta uma tríade letal de riscos:
- Acesso profundo a dados privados locais — o agente pode ler arquivos, acessar credenciais armazenadas e interagir com recursos do sistema operacional de formas que a maioria dos usuários nem imagina
- Interação com conteúdo externo não confiável — ao navegar na web e processar dados de terceiros, o agente fica exposto a inputs maliciosos que podem subverter seu comportamento
- Capacidade de se comunicar externamente — o agente pode enviar dados para fora da máquina, o que transforma qualquer comprometimento interno em um potencial vazamento de dados completo
Não é surpresa, portanto, que o OpenClaw já tenha publicado mais de 255 GitHub Security Advisories. Muitas das falhas estão ligadas a execução de comandos, chaves de API e credenciais expostas em texto puro, que podem ser roubadas por agentes maliciosos por meio de prompt injection indireta, skills maliciosas ou endpoints inseguros.
Prompt injection indireta: o caso ClawJacked
O OpenClaw é vulnerável a ataques de prompt injection indireta, onde atacantes escondem instruções maliciosas dentro de dados que o agente é esperado para processar. Se o agente interpreta essas instruções ocultas como legítimas, ele pode vazar dados ou executar ações sensíveis sem que o usuário perceba.
Essa técnica foi justamente o que tornou possível o ClawJacked, uma vulnerabilidade que permitia que sites maliciosos realizassem ataques de força bruta e sequestrassem instâncias do OpenClaw rodando localmente. Pesquisadores da Oasis Security descobriram a falha, que possibilitava aos atacantes exfiltrar dados silenciosamente ao abusar da autonomia nativa do agente. O OpenClaw corrigiu o problema na versão 2026.2.26, lançada em 26 de fevereiro.
Esse tipo de ataque é particularmente perigoso porque não depende de nenhuma ação explícita do usuário. Basta visitar uma página comprometida para que o agente local seja explorado. É o tipo de cenário que desmonta qualquer argumento do tipo eu tenho cuidado com os links que clico. Aqui, o cuidado do usuário é insuficiente porque o vetor de ataque explora a lógica do próprio agente, não a desatenção humana.
ClawHub e a campanha de malware ClawHavoc
Os desafios de segurança vão muito além das vulnerabilidades na plataforma central. O ClawHub, um repositório comunitário para compartilhamento de skills do OpenClaw, foi explorado para distribuir pacotes maliciosos disfarçados como bots de trading, utilitários ou ferramentas de desenvolvimento. Uma vez instaladas, essas skills podem implantar malware que rouba informações diretamente na máquina do usuário.
No início de 2026, investigadores descobriram o ClawHavoc, uma campanha de malware em larga escala voltada para a cadeia de suprimentos de software dos usuários do OpenClaw. Atacantes carregaram mais de 1.100 skills maliciosas no ClawHub, muitas se passando por ferramentas de produtividade, cripto ou programação. Um atacante identificado como hightower6eu carregou dezenas de skills maliciosas praticamente idênticas. Várias delas se tornaram alguns dos pacotes mais baixados na plataforma.
Esse ataque deixou claro que o ecossistema de skills do OpenClaw se transformou em um ambiente rico em alvos para agentes maliciosos. O modelo aberto e comunitário, que é um dos grandes atrativos da ferramenta, também é o que a torna mais exposta a esse tipo de abuso quando não existem mecanismos robustos de verificação e curadoria de pacotes.
O sistema de rastreamento de vulnerabilidades está ficando para trás
A Agentic AI cresce rápido e o volume de vulnerabilidades está ultrapassando a capacidade dos sistemas tradicionais de rastreamento. O ritmo de divulgações relacionadas ao OpenClaw é mais veloz do que o processo de atribuição de CVEs consegue acompanhar, deixando muitas vulnerabilidades sem identificadores CVE formais.
Isso é muito mais do que um problema administrativo. A maioria das ferramentas de gerenciamento de patches, frameworks de compliance e sistemas de segurança corporativa depende fortemente dos CVE IDs para identificar riscos e acompanhar a remediação. Quando vulnerabilidades não recebem CVEs, elas podem simplesmente não aparecer em dashboards, scanners ou relatórios automatizados. Na prática, isso as torna invisíveis para muitas organizações.
O cenário de divulgação de vulnerabilidades está começando a mostrar seus limites, e sistemas de Agentic AI como o OpenClaw estão expondo o quão despreparados estamos para essa classe emergente de problemas de segurança. O sistema tradicional de rastreamento via CVE foi construído para falhas de software bem definidas e discretas, não para sistemas autônomos capazes de tomar ações, navegar em conteúdo externo e encadear ferramentas para completar tarefas.
Como resultado, muitas falhas de segurança significativas em IA surgem primeiro como writeups de pesquisa independentes, advisories de fornecedores ou inconsistências comportamentais estranhas, e não como vulnerabilidades bem rotuladas e catalogadas.
Por que o ecossistema de segurança ainda está atrás
Uma das razões pelas quais casos como o do OpenClaw conseguem escalar antes de serem contidos é estrutural: as ferramentas de cibersegurança disponíveis no mercado foram desenhadas para identificar padrões de ataque conhecidos em sistemas com comportamento previsível. Agentes autônomos de IA, por definição, têm comportamento adaptativo. Eles tomam caminhos diferentes dependendo do contexto, e isso torna extremamente difícil distinguir uma ação legítima de uma ação comprometida apenas olhando para os logs de execução. As equipes de segurança precisam de novas abordagens, e a maioria das empresas ainda não tem essas abordagens implementadas.
Além disso, o ritmo de publicação de vulnerabilidades em 2026 deixa claro que o problema não é isolado. Com cerca de 15.000 CVEs divulgados só neste ano, e uma parcela crescente deles relacionada a sistemas que envolvem IA generativa ou código produzido por modelos de linguagem, fica evidente que o campo de segurança está correndo atrás de uma realidade que já escapou do controle em vários pontos. Cada nova ferramenta de agentes que entra no mercado sem passar por um processo rigoroso de revisão de segurança adiciona mais uma camada de risco a um ambiente que já estava sobrecarregado.
O caminho para frente envolve uma mudança de mentalidade que vai além de simplesmente adicionar mais scanners ou mais regras de firewall. As organizações que estão levando a sério a adoção de Agentic AI precisam incorporar práticas de segurança desde o design dos agentes, definindo escopos de permissão mínimos, implementando validação rigorosa de instruções em cada etapa da pipeline e estabelecendo mecanismos de monitoramento que consigam detectar desvios de comportamento em tempo real. Isso não é opcional, é o piso mínimo para operar com responsabilidade nesse novo cenário.
O que muda na prática para quem usa ou desenvolve agentes
Para quem está desenvolvendo ou integrando soluções baseadas em Agentic AI, o caso do OpenClaw funciona como um mapa do que não fazer. A primeira lição é clara: popularidade não é sinônimo de segurança. Uma ferramenta com milhares de estrelas no GitHub pode ter sido revisada por muita gente em termos de funcionalidade e praticidade, mas isso não garante que alguém olhou para ela com os olhos de quem está tentando encontrar uma brecha para explorar. Auditorias de segurança independentes, revisão de código com foco em vetores de ataque específicos para IA e testes de red team voltados para injeção de prompt são etapas que precisam fazer parte do processo antes de qualquer coisa ir para produção.
A segunda lição diz respeito ao princípio do menor privilégio aplicado a agentes autônomos. Um agente que precisa ler arquivos de log não precisa ter permissão para escrever em bancos de dados. Um agente que gerencia comunicações não precisa ter acesso ao sistema de pagamentos. Parece óbvio, mas a pressa na implementação faz com que muitas equipes concedam permissões amplas logo de cara para simplificar a configuração inicial, e depois nunca revisitam esse ponto. Esse erro de design é exatamente o que transforma uma vulnerabilidade de baixo impacto em um vetor de exploração crítico.
A terceira lição é sobre visibilidade. Agentes autônomos precisam de trilhas de auditoria detalhadas que registrem não apenas o que fizeram, mas por que fizeram, ou seja, qual instrução originou qual ação, em qual contexto e com quais parâmetros. Sem esse nível de rastreabilidade, investigar um incidente de segurança em um sistema de Agentic AI é como tentar reconstruir uma conversa inteira a partir de uma única frase. É quase impossível entender o que aconteceu, muito menos garantir que não vai acontecer de novo. 🔍
Tratando vulnerabilidades de IA como riscos em nível de sistema
No curto prazo, as organizações precisam começar a tratar as fraquezas da Agentic AI como riscos em nível de sistema, e não apenas como entradas faltantes no banco de dados de CVEs. Isso significa expandir o monitoramento para além dos feeds de CVE tradicionais, fortalecer controles arquiteturais como escopo de permissões e auditoria de ações, e reconhecer que a exploração pode acontecer antes de qualquer divulgação formal ser publicada.
Até que os padrões da indústria evoluam para dar conta adequadamente de sistemas orientados por IA, a resiliência vai depender de três pilares fundamentais:
- Detecção precoce de sinais — monitorar pesquisas independentes, advisories de fornecedores e comunidades de segurança para identificar riscos antes que eles entrem nos canais formais
- Contenção rápida — ter playbooks prontos para isolar agentes comprometidos sem paralisar toda a operação
- Reconhecimento de que vulnerabilidades de IA não são um problema futuro — elas já estão presentes em ambientes de produção, e os atacantes não estão esperando o resto do ecossistema se atualizar
A realidade é que estamos entrando de cabeça em uma nova classe de problemas de segurança, e a infraestrutura atual simplesmente não foi construída para isso. O processo tradicional de atribuição e enriquecimento de CVEs está trabalhando para se adaptar, mas as organizações não podem se dar ao luxo de esperar atualizações formais antes de agir.
O cenário de Agentic AI em 2026 deixa uma mensagem bem direta: a velocidade da inovação em IA ultrapassou a velocidade da segurança. E fechar essa lacuna não é responsabilidade de um único fornecedor, framework ou órgão regulador. É um esforço coletivo que exige atenção constante, adaptação rápida e, acima de tudo, honestidade sobre o tamanho do desafio que temos pela frente. 🛡️
