Anthropic criou um marketplace de teste onde AI agents negociam entre si com dinheiro real
Os AI agents acabaram de provar que conseguem fechar negócio melhor do que muita gente esperava.
A Anthropic conduziu um experimento que poucos sabiam que existia: um marketplace interno, onde agentes de inteligência artificial atuaram como compradores e vendedores de verdade, com produtos reais e dinheiro real em jogo. A iniciativa foi batizada de Project Deal e os resultados surpreenderam até quem estava no comando.
O cenário era simples, mas o impacto foi grande.
Ao todo, 69 funcionários da própria Anthropic participaram da experiência, cada um com um orçamento de 100 dólares — pagos em gift cards — para gastar comprando itens dos colegas. Tudo intermediado por agentes de IA que representavam tanto o lado comprador quanto o lado vendedor.
A própria empresa reconheceu que o teste foi apenas um experimento piloto com um grupo autosselecionado de participantes, mas ainda assim ficou impressionada com o desempenho geral. E não é difícil entender o porquê 👀
Ao longo de todo o teste, foram registradas 186 transações, movimentando mais de 4 mil dólares em valor negociado.
Mas o número mais revelador não está nos valores em si, e sim no que aconteceu nos bastidores dessas negociações.
Quatro marketplaces diferentes para entender o que funciona
Uma das partes mais interessantes do Project Deal é que a Anthropic não se limitou a criar um único marketplace. Na verdade, a empresa rodou quatro marketplaces separados, cada um utilizando configurações e modelos diferentes. Apenas um deles era considerado o marketplace real, onde todos os participantes eram representados pelo modelo mais avançado da companhia e onde as negociações seriam efetivamente honradas após o término do experimento. Os outros três serviram como ambientes de estudo para comparar comportamentos e resultados sob condições variadas.
Essa abordagem multifacetada foi fundamental para que a Anthropic conseguisse extrair insights mais profundos sobre a dinâmica entre AI agents em cenários comerciais. Ao isolar variáveis como a capacidade do modelo e as instruções iniciais fornecidas aos agentes, a equipe conseguiu identificar padrões que seriam invisíveis em um teste único e uniforme. Foi justamente essa separação que revelou uma das descobertas mais impactantes de todo o experimento.
Quando os usuários eram representados por modelos mais avançados, eles obtinham resultados objetivamente melhores nas negociações. Ou seja, o agente mais capaz conseguia extrair mais valor para o seu representado, seja negociando preços mais baixos na hora da compra ou garantindo condições mais favoráveis na venda. Isso por si só já seria um achado relevante, mas o que veio a seguir adicionou uma camada extra de complexidade ao cenário.
O problema invisível da disparidade entre agentes
Aqui é onde as coisas ficam realmente provocativas. A Anthropic identificou que, apesar da diferença clara de performance entre modelos mais e menos avançados, os próprios usuários não percebiam a disparidade. Quem estava sendo representado por um agente menos capaz não notava que estava saindo em desvantagem nas negociações. A empresa destacou que isso levanta a possibilidade real de surgirem lacunas de qualidade entre agentes, onde as pessoas do lado perdedor podem simplesmente não perceber que estão em desvantagem.
Essa descoberta tem implicações enormes para o futuro dos AI agents em ambientes comerciais. Se um consumidor contrata um serviço de agente de IA para negociar em seu nome e esse agente é inferior ao do outro lado da mesa, a negociação já começa desequilibrada — e o pior: sem que ninguém perceba. Isso cria um cenário onde a qualidade do modelo de IA que você utiliza pode se tornar um fator determinante no seu poder de negociação, quase como uma vantagem competitiva silenciosa.
Para quem acompanha o mercado de inteligência artificial, esse achado coloca uma discussão importante na mesa sobre equidade e transparência em negociações intermediadas por IA. Se a tendência de uso de AI agents em transações comerciais continuar crescendo — e tudo indica que vai — será necessário pensar em mecanismos que tornem visíveis essas diferenças de capacidade, para que os usuários possam tomar decisões informadas sobre qual agente utilizar.
Instruções iniciais fizeram pouca diferença
Outro dado curioso que surgiu do Project Deal diz respeito às instruções iniciais fornecidas aos agentes. A Anthropic revelou que as orientações dadas no início das negociações não pareceram afetar significativamente a probabilidade de uma venda ser concluída nem os preços finais negociados. Em outras palavras, independentemente de como o usuário configurava o comportamento inicial do seu agente, os resultados tendiam a convergir para um padrão semelhante.
Isso é particularmente interessante porque contraria uma intuição comum no uso de modelos de linguagem. Muita gente acredita que a forma como você instrui um agente de IA — o famoso prompt — é o fator decisivo para obter bons resultados. No contexto do Project Deal, porém, o que realmente fez diferença foi a capacidade intrínseca do modelo, e não a orientação que ele recebeu antes de começar a negociar.
Essa descoberta tem implicações diretas para empresas e desenvolvedores que estão construindo soluções baseadas em AI agents. Ela sugere que investir na qualidade e na sofisticação do modelo subjacente pode ser mais eficiente do que gastar tempo refinando prompts e scripts de comportamento, pelo menos no contexto de negociações autônomas. É claro que essa conclusão precisa ser testada em escalas maiores e em cenários mais diversos, mas como ponto de partida, é uma informação valiosa.
O que estava sendo negociado nesse marketplace?
Diferente de um ambiente controlado e artificial, o marketplace do Project Deal funcionava com itens do dia a dia que os próprios funcionários colocavam à venda, como eletrônicos usados, roupas, livros, acessórios e outros bens pessoais. Cada vendedor definia o preço inicial do seu produto, e os AI agents entravam em cena para representar tanto quem queria comprar quanto quem queria vender, conduzindo as negociações de ponta a ponta sem que os humanos precisassem intervir em cada etapa do processo. Era exatamente esse nível de autonomia que a Anthropic queria colocar à prova.
O que chamou atenção desde o começo foi a naturalidade com que os agentes lidaram com situações que normalmente exigem julgamento humano. Eles precisavam avaliar se um preço estava justo, se havia margem para desconto, como apresentar uma contraproposta sem afastar o outro lado e como fechar o negócio no momento certo. Esse tipo de raciocínio envolve muito mais do que seguir um roteiro fixo, e os agentes demonstraram uma capacidade adaptativa que surpreendeu a equipe responsável pelo projeto.
Além disso, o fato de o dinheiro ser real mudou completamente a dinâmica do experimento. Quando há consequências concretas, os participantes levam o processo a sério, e os funcionários da Anthropic não foram diferentes. Eles tinham 100 dólares para gastar e queriam fazer boas compras. Isso criou uma pressão legítima sobre os AI agents, que precisavam performar bem o suficiente para ganhar a confiança dos usuários e concluir as transações com sucesso.
Como os AI agents se saíram nas negociações?
A performance dos agentes ao longo do Project Deal foi o coração de tudo. Com 186 transações registradas e mais de 4 mil dólares em valor negociado, os números falam por si só, mas o que ficou ainda mais evidente foi a qualidade das interações. Os agentes não apenas concluíram as negociações — eles conduziram conversas estratégicas, identificaram o momento certo para ceder em um ponto e firmar posição em outro, e souberam calibrar o tom dependendo do contexto de cada negociação. Esse nível de sofisticação não era esperado nessa escala pelos próprios organizadores do experimento.
Um dos aspectos mais interessantes foi a forma como os AI agents lidaram com impasses. Em situações onde comprador e vendedor estavam distantes em termos de preço, os agentes encontraram formas criativas de destravar a conversa, seja sugerindo condições alternativas, destacando características específicas do produto ou simplesmente ajustando a abordagem para tornar a proposta mais atraente. Isso demonstra que o raciocínio dos agentes vai muito além de uma lógica transacional simples e começa a se aproximar de algo que, até pouco tempo atrás, seria considerado exclusivamente humano.
A performance geral também se destacou pela consistência. Não foram apenas alguns casos isolados de sucesso. O volume alto de transações concluídas, combinado com a satisfação relatada pelos funcionários participantes, indicou que os agentes conseguiram manter um padrão elevado ao longo de todo o período de teste. Para a Anthropic, isso representou uma validação importante de que os seus modelos de IA estão prontos para operar em cenários mais complexos e com maior grau de responsabilidade.
O que o Project Deal revela sobre o futuro dos AI agents
O Project Deal não foi apenas um experimento interno divertido. Ele funcionou como um termômetro real para entender até onde os AI agents conseguem ir quando colocados em ambientes com variáveis humanas genuínas. E o resultado apontou para uma direção clara: esses agentes estão evoluindo rápido, e a capacidade de atuar em marketplaces com autonomia real, conduzindo transações do início ao fim, já não é mais uma promessa futura. É uma realidade testada e documentada.
Para quem acompanha o mercado de tecnologia e inteligência artificial, esse experimento levanta questões muito relevantes sobre como os AI agents podem ser integrados em plataformas comerciais. Imagine um marketplace de e-commerce onde os agentes negociam condições de frete, descontos por volume ou prazos de entrega diretamente com fornecedores, sem que o time humano precise intervir em cada detalhe. Ou plataformas de serviços onde os agentes ajudam clientes a encontrar o melhor pacote dentro do orçamento disponível, conduzindo a conversa de forma natural e personalizada. O Project Deal mostrou que essa infraestrutura já tem base para funcionar.
Além disso, a descoberta sobre a disparidade entre modelos adiciona uma camada importante de reflexão. Se no futuro os AI agents forem amplamente utilizados em negociações comerciais, a escolha do modelo por trás do agente pode se tornar tão relevante quanto a escolha de um bom advogado ou corretor. A diferença é que, enquanto sabemos avaliar a competência de um profissional humano, ainda não temos referências claras para medir a capacidade de um agente de IA em contextos de negociação real. O Project Deal começou a preencher essa lacuna.
Os números que ficam
Quando a gente para para olhar para o que o Project Deal produziu em termos concretos, é impossível não reconhecer a relevância do que foi alcançado. Um marketplace interno que movimentou mais de 4 mil dólares em valor negociado, com 186 transações concluídas entre 69 participantes, usando agentes de IA como intermediários em tempo real, é um resultado que vai muito além do que a maioria dos experimentos do setor conseguiu documentar até agora. Não estamos falando de simulações ou de cenários hipotéticos. Cada negociação aconteceu com dinheiro real e pessoas reais do outro lado.
Esses dados também jogam uma luz interessante sobre a discussão de performance em ambientes econômicos. A taxa de conclusão das transações e o volume financeiro envolvido sugerem que os AI agents conseguiram criar valor percebido suficiente para que os compradores se sentissem confortáveis em finalizar as compras. Em outras palavras, os agentes passaram no teste mais difícil de todos: o da confiança. E quando um agente de IA consegue conquistar a confiança de um ser humano em uma negociação com dinheiro real em jogo, isso diz muito sobre o estágio de maturidade em que essa tecnologia se encontra.
O Project Deal também abre espaço para uma conversa mais ampla sobre como os próximos marketplaces serão desenhados. Se os AI agents conseguem operar com esse nível de autonomia e eficiência em um ambiente controlado, as implicações para plataformas comerciais em larga escala são enormes. A experiência da Anthropic funciona como um modelo de referência, mostrando que é possível estruturar ecossistemas onde agentes de IA participam ativamente do processo econômico — não apenas como ferramentas de suporte, mas como protagonistas das negociações 🚀
