O chefe de gabinete de um bilionário: como um pioneiro da IA coloca uma dúzia de agentes para trabalhar
Agentes de IA já fazem parte da rotina de trabalho de algumas das mentes mais brilhantes do setor de tecnologia. E quando falamos de um dos criadores da arquitetura que deu origem ao ChatGPT usando uma dúzia deles no seu dia a dia, vale a pena parar e prestar atenção no que ele tem a dizer.
Illia Polosukhin não é qualquer nome no mundo da inteligência artificial. Ele é coautor do paper Attention Is All You Need, publicado em 2017, que apresentou ao mundo a arquitetura Transformer, a base técnica por trás dos grandes modelos de linguagem que conhecemos hoje. Em outras palavras, o T do ChatGPT existe por causa do trabalho dele.
Mas aqui vem o detalhe mais interessante de tudo isso: mesmo sendo um dos maiores especialistas do planeta no tema, Polosukhin não deixa seus agentes trabalharem soltos. E o motivo é mais simples do que parece. 👇
Uma dúzia de agentes e uma descrição bem direta no prompt
No dia a dia, Polosukhin trabalha com 12 agentes completando diferentes missões para ele. Uma dessas missões, por exemplo, é ajudá-lo a se tornar um CEO melhor. Na prática, o agente resume todas as notas de reuniões, documentos do Google Drive e mensagens do Slack, e depois entrega um resumo executivo com coaching sobre o que aconteceu, o que ele pode estar deixando passar e onde existem decisões travadas. Esse fluxo roda toda semana de forma automatizada.
E a descrição que ele usa para esses agentes é bem reveladora. Polosukhin os chama de seu suporte no nível de chefe de gabinete de um bilionário. Segundo ele, essa frase está literalmente no prompt: você é o chefe de gabinete de um bilionário. É uma instrução clara e direta que define o nível de responsabilidade e contexto que o agente precisa ter ao executar suas tarefas.
Essa abordagem oferece um vislumbre do futuro que Polosukhin enxerga não só para trabalhadores individuais ou CEOs, mas para toda a economia global. Um mundo onde agentes podem fazer negociações, coordenar cadeias de suprimentos e intermediar transações em nome de pessoas e grandes empresas. E, na visão dele, nós estamos completamente despreparados para isso.
O que Polosukhin faz diferente no uso de agentes
Em vez de configurar seus agentes de IA para rodar de forma totalmente autônoma, Polosukhin mantém o que ele mesmo descreve como pontos de verificação ao longo dos fluxos de trabalho. Em momentos estratégicos, o agente para, apresenta o que fez até ali e aguarda uma confirmação humana antes de continuar. Isso não é uma limitação tecnológica, é uma escolha deliberada e bem fundamentada. Para quem usa agentes no trabalho, essa abordagem muda completamente a dinâmica de confiança entre humano e máquina, porque você sabe exatamente o que está sendo feito e em qual etapa o processo se encontra.
Esse comportamento não vem de desconfiança cega na tecnologia. Polosukhin entende melhor do que quase qualquer pessoa como esses sistemas funcionam por dentro, justamente porque ajudou a construir a base deles. O ponto aqui é que a supervisão humana não é um sinal de que a IA falhou. É uma camada de segurança que garante que o resultado final realmente corresponda ao que você queria desde o início. Quando um agente toma decisões em cadeia sem nenhuma pausa para revisão, pequenos erros de interpretação no começo podem virar grandes problemas no final.
Como ele mesmo resumiu em entrevista ao Business Insider: se eu simplesmente deixar rodar e fazer as coisas, eu volto e encontro algo que não faz sentido nenhum. Então você precisa ficar de olho com o seu próprio julgamento.
Além disso, existe um aspecto prático muito relevante nessa discussão. Agentes que operam de forma autônoma em tarefas complexas costumam interagir com sistemas externos, APIs, bancos de dados e ferramentas diversas. Cada uma dessas interações representa um ponto onde algo pode sair do trilho, seja por uma instrução mal interpretada, uma resposta inesperada de um serviço externo ou simplesmente uma decisão que fazia sentido para o modelo mas não fazia sentido para o contexto real do negócio. Ter um humano no loop, especialmente nesses pontos críticos, reduz significativamente esse risco.
A sociedade não está preparada para a AGI, segundo Polosukhin
Para além dos desafios operacionais de usar agentes no dia a dia, Polosukhin levanta uma preocupação bem mais ampla. Segundo ele, o maior problema é que nós fundamentalmente não preparamos o sistema para a inteligência artificial geral (AGI) estar disponível. E quando ele fala em sistema, está se referindo à sociedade, à internet e às instituições governamentais.
Essa é uma declaração forte, especialmente vindo de alguém que não é um comentarista externo, mas sim um dos arquitetos da tecnologia que está no centro dessa revolução. Polosukhin conta que vem alertando há anos que os modelos vão começar a quebrar tudo. Ele descreve a situação como um jogo de gato e rato, onde cada nova iteração de modelo consegue quebrar aquilo que a iteração anterior havia corrigido.
Um exemplo concreto que reforça essa visão veio da Anthropic, que anunciou que seu modelo mais recente em prévia, o Mythos, é tão capaz de encontrar e explorar vulnerabilidades que o laboratório decidiu limitar o acesso a ele. Para Polosukhin, isso não é surpresa. É exatamente o tipo de cenário que ele vem descrevendo há anos.
O problema da confiança cega em uma única empresa
Em um mundo onde pessoas gerenciam sua saúde e corporações gerenciam logística usando agentes de IA, Polosukhin identifica uma necessidade urgente de uma camada de confiança e segurança no backend. E é exatamente nisso que ele está trabalhando no NEAR.
O projeto dele com o NEAR está construindo infraestrutura para reduzir a dependência dos agentes de IA em uma única empresa, como um laboratório de IA frontier, para controlar e supervisionar cada etapa de uma tarefa. Na prática, isso significa que um agente de IA que lida com suas informações de login, reserva suas viagens e movimenta dinheiro para pagar uma passagem aérea não exigiria que o usuário confiasse cegamente em um único porteiro.
A preocupação de Polosukhin aqui é bem fundamentada. Como ele explicou: isso vai ter todas as suas informações. Literalmente, sua vida vai estar ali. Então você não quer que nenhuma empresa individual tenha controle ou acesso a tudo isso.
E não estamos falando só de vazamento de dados. Outro risco que Polosukhin quer combater é o de manipulação. Cada vez mais pessoas usam IA para obter informações, desde resumos de notícias até sugestões de investimento. Um laboratório de IA, ou um agente mal-intencionado dentro dele, poderia moldar discretamente essas respostas sem que o usuário percebesse.
Um caso real que ilustra esse perigo aconteceu com o Grok, da xAI, quando o chatbot começou a mencionar repetidamente um tema extremamente sensível em respostas que não tinham nenhuma relação com o assunto. A empresa atribuiu o problema a uma modificação não autorizada no backend do sistema. Esse tipo de incidente mostra como a falta de transparência pode ter consequências graves.
A proposta de Polosukhin com o NEAR é desenvolver uma plataforma de código aberto e auditável, que dê aos usuários maior visibilidade sobre como um sistema de IA opera, em vez de tratá-lo como uma caixa preta.
Por que a infraestrutura backend importa nessa equação
Quando você começa a colocar agentes de IA para trabalhar de verdade, a conversa rapidamente sai do nível das prompts e vai direto para a infraestrutura backend que sustenta tudo isso. Não adianta ter um agente bem configurado e inteligente se a estrutura por trás dele não consegue registrar o que ele fez, não guarda contexto entre as sessões ou não oferece nenhuma visibilidade sobre as ações executadas.
A infraestrutura backend de um sistema com agentes precisa, no mínimo, oferecer rastreabilidade. Isso significa conseguir responder perguntas como:
- O que esse agente fez nas últimas duas horas?
- Quais ferramentas ele usou?
- Quais decisões ele tomou de forma autônoma e quais ele escalou para um humano?
Sem essas respostas disponíveis de forma clara, a supervisão humana fica comprometida porque você não tem nem as informações necessárias para supervisionar nada. É como tentar revisar um documento sem conseguir ver o histórico de edições.
Outro ponto que merece atenção é a questão da latência e da confiabilidade dos sistemas que os agentes acessam. Um agente que depende de múltiplos serviços externos para completar uma tarefa está exposto a falhas em cascata se qualquer um desses serviços apresentar lentidão ou instabilidade. Por isso, arquitetar a infraestrutura pensando em resiliência, com fallbacks bem definidos e timeouts adequados, é parte essencial de qualquer deployment sério de agentes de IA em ambiente produtivo. Isso não é detalhe técnico secundário. É o que separa um experimento de laboratório de uma solução que funciona de verdade.
De vibe coding a agentes: a visão que veio de 2017
Muito pouco sobre a trajetória da IA surpreende Polosukhin. No mesmo ano em que o paper da arquitetura Transformer foi publicado, ele fundou o NEAR AI em torno da ideia de que máquinas poderiam eventualmente gerar software. A tese dele era simples: humanos conversariam com computadores em linguagem natural, como inglês, e as máquinas escreveriam o código.
Em 2017, essa ideia parecia bem absurda, como ele mesmo admitiu. Hoje, isso tem nome: vibe coding. É uma das tendências mais quentes do momento, com desenvolvedores usando modelos de linguagem para gerar código a partir de descrições em texto. Ou seja, o que parecia ficção científica há menos de uma década virou ferramenta de trabalho.
Essa capacidade de enxergar para onde a tecnologia caminha anos antes de ela chegar é o que torna as opiniões de Polosukhin particularmente valiosas. Quando alguém com esse histórico diz que a supervisão humana ainda é fundamental, vale a pena levar a sério.
O papel do Transformer nessa nova geração de agentes
Entender o que faz os agentes de IA atuais tão capazes passa, obrigatoriamente, pelo entendimento da arquitetura Transformer. Quando Polosukhin e seus colegas publicaram o paper em 2017, o foco era em tarefas de tradução automática. Mas o mecanismo de atenção que eles descreveram provou ser incrivelmente versátil, e nos anos seguintes virou a espinha dorsal de praticamente todos os grandes modelos de linguagem, incluindo as famílias GPT, Claude, Gemini e Llama. É essa arquitetura que permite que um modelo mantenha contexto ao longo de uma conversa longa, que entenda nuances de linguagem e que conecte informações aparentemente distantes dentro de um texto.
Mas a arquitetura Transformer, por mais poderosa que seja, tem limites bem conhecidos. O modelo trabalha com probabilidade, não com certeza. Ele gera a resposta mais provável dado o contexto que recebeu, e isso significa que em situações ambíguas ou fora do padrão do seu treinamento, ele pode produzir respostas plausíveis que estão simplesmente erradas. Quando você coloca esse tipo de modelo no centro de um agente que toma ações reais no mundo, seja enviando e-mails, executando código ou modificando arquivos, essa margem de erro deixa de ser apenas uma inconveniência e se torna um risco concreto.
É exatamente aí que a supervisão humana fecha o ciclo de forma elegante. O Transformer é excelente para processar informação, identificar padrões, gerar texto e raciocinar sobre problemas complexos. O humano é excelente para validar se aquilo que foi gerado faz sentido no contexto real, se está alinhado com os objetivos do negócio e se não vai causar nenhum efeito colateral indesejado. Quando esses dois trabalham juntos, com o agente fazendo o trabalho pesado e o humano fazendo as revisões estratégicas, o resultado tende a ser muito melhor do que qualquer um dos dois conseguiria sozinho.
O que isso muda na forma de pensar automação com IA
A narrativa popular em torno dos agentes de IA costuma enfatizar autonomia total como o objetivo final. A ideia de ter um agente que cuida de tudo enquanto você faz outra coisa é sedutora, e não é completamente irrealista para tarefas muito bem definidas e de baixo risco. Mas quando o escopo aumenta e as tarefas envolvem julgamento, criatividade, contexto organizacional ou impacto em outras pessoas, a autonomia sem supervisão começa a criar mais problemas do que resolve. Polosukhin, com toda a sua bagagem técnica, chegou a essa conclusão de forma prática, não teórica.
O que muda na prática é a forma como você projeta seus fluxos de trabalho com agentes. Em vez de perguntar como faço para que o agente faça tudo sozinho, a pergunta mais produtiva costuma ser: em quais momentos faz sentido trazer um humano para o loop e em quais momentos o agente pode avançar com segurança? Essa distinção exige que você entenda bem tanto as capacidades quanto as limitações do modelo que está usando, e também que você conheça profundamente o processo que está tentando automatizar. Não existe atalho aqui.
O pesquisador também mostrou ao Business Insider como um de seus agentes consegue agregar notícias sobre temas geopolíticos, como o cessar-fogo entre EUA e Irã, e fornecer leituras de mercado a partir dessas informações. Outros são agentes de desenvolvimento que escrevem código, e há também um agente de crescimento que propõe passos para aumentar uma determinada métrica dentro da empresa dele. São aplicações práticas e variadas, mas todas com o mesmo princípio: o humano continua no centro da decisão.
A lição mais valiosa de quem construiu a base da IA generativa
O que a experiência de Polosukhin deixa como ensinamento mais valioso é que usar inteligência artificial com maturidade não significa usá-la ao máximo de sua autonomia o tempo todo. Significa usá-la de forma estratégica, sabendo onde ela brilha, onde ela precisa de ajuda e como construir sistemas que tirem o melhor dos dois mundos.
A IA ainda luta com bom senso, mesmo enquanto as conversas online sobre o tema podem exagerar o progresso atual. Essa é uma observação que vem de alguém que não está do lado de fora comentando, mas de dentro, construindo e usando a tecnologia diariamente.
Especialistas que chegaram a essa conclusão por conta própria, depois de anos trabalhando com a tecnologia na prática, costumam ser os melhores guias para quem está começando essa jornada agora. E a mensagem central de Polosukhin é clara: coloque seus agentes para trabalhar, mas mantenha o olho aberto e o julgamento ligado. 🤖
