Os chatbots de inteligência artificial estão no centro de uma polêmica que mistura tecnologia e política de um jeito que poucos esperavam.
Quando o presidente Donald Trump assinou uma ordem executiva determinando que as IAs sejam ferramentas neutras e apartidárias, o debate sobre o viés político dessas tecnologias saiu do campo da especulação e virou uma questão concreta, urgente e com implicações reais para milhões de pessoas. A medida também gerou reações do lado democrata, que passou a temer que a IA pudesse começar a pender para a direita por pressão política.
Mas será que os chatbots realmente têm viés político?
O Washington Post resolveu ir além da polêmica e colocar essa pergunta à prova de verdade, testando os principais modelos de IA disponíveis hoje com perguntas políticas calibradas por pesquisadores de universidades como Dartmouth e Stanford. Foram avaliados os modelos por trás do ChatGPT, da OpenAI, do Gemini, do Google, além de Anthropic, DeepSeek, xAI e Gab.
Os resultados foram, no mínimo, surpreendentes 👀
Entre os achados mais chamativos, o modelo por trás do ChatGPT respondeu quase todas as perguntas apenas com argumentos de esquerda, apresentando uma posição de direita uma única vez, totalizando cerca de 80% das respostas com inclinação progressista. Já o Gemini, do Google, foi o único a apresentar os dois lados em mais de 90% das respostas.
E tem mais: até o Grok, da xAI de Elon Musk, que é comercializado como uma alternativa anti-woke e voltada à busca pela verdade, também citou mais argumentos progressistas na média geral.
Neste artigo, você vai entender como o teste foi conduzido, o que os números revelam sobre cada modelo, o que as empresas disseram sobre os resultados e por que a neutralidade total em IA pode ser, na prática, uma ilusão difícil de alcançar 🤖
Como o teste foi conduzido
A metodologia por trás da investigação do Washington Post não foi improvisada. O jornal se baseou em uma pesquisa publicada no ano passado pelo laboratório de Sean Westwood, diretor do Polarization Research Lab da Dartmouth College, em parceria com pesquisadores da Universidade de Stanford. Esse estudo desenvolveu mais de duas dúzias de perguntas políticas pensadas para refletir o tipo de questão que pessoas comuns poderiam fazer a um chatbot.
Cada modelo foi solicitado a responder as perguntas em no máximo 30 palavras, sem configurações de personalização ativadas. Um repórter revisou as respostas para classificar se elas continham uma posição de esquerda, uma posição de direita ou ambas. Os temas políticos raramente se dividem de forma limpa entre partidos, mas as perguntas cobriram uma ampla gama de assuntos, e o jornal verificou se os modelos eram consistentes em suas respostas, repetindo cada questão cinco vezes para garantir a confiabilidade dos dados.
Esse tipo de análise quantitativa e qualitativa combinada é o que dá peso científico aos resultados e os torna difíceis de ignorar, independentemente do lado político do leitor. Segundo Westwood, entender as posições que essas ferramentas amplificam é importante porque elas estão se tornando cada vez mais influentes, à medida que mais pessoas as usam para compreender o mundo e os eventos noticiosos. Como ele resumiu, essas ferramentas de IA não estão apresentando, em média, uma representação verdadeiramente neutra de debates políticos cheios de nuances.
Vale destacar que esse tipo de estudo não é novidade absoluta no campo da pesquisa sobre bias em inteligência artificial. Vários estudos acadêmicos anteriores já haviam encontrado que modelos de IA tendem a favorecer posições de esquerda. Mas o timing desta investigação específica ganhou peso adicional por conta do contexto político nos Estados Unidos. Com a ordem executiva de Trump colocando o tema na agenda pública e empresas de tecnologia sendo pressionadas a se posicionarem, os dados levantados pelo Washington Post chegaram num momento em que a discussão sobre tendências políticas em sistemas de IA já não é mais um debate restrito a acadêmicos ou entusiastas. É uma conversa que chegou ao mainstream.
O que os números revelam sobre cada modelo
O resultado que mais chamou atenção foi o do modelo por trás do ChatGPT, desenvolvido pela OpenAI, que deu as respostas mais inclinadas de todos. Cerca de 80% delas apresentaram apenas argumentos de esquerda. O modelo defendeu, por exemplo, abolir o colégio eleitoral em favor da escolha do presidente por voto popular, aumentar impostos sobre os mais ricos e adotar um sistema de saúde de pagador único. Isso não significa necessariamente que o modelo foi programado para defender uma ideologia específica, mas indica que os dados de treinamento, combinados com as escolhas de ajuste fino da OpenAI, resultaram num padrão de resposta que pende para uma direção. Esse é exatamente o tipo de bias que preocupa pesquisadores, porque age de forma sutil, muitas vezes invisível para o usuário comum que recebe uma resposta e a aceita como neutra.
A IA da empresa chinesa DeepSeek ficou logo atrás e também pendeu para a esquerda em suas respostas. Tanto ela quanto o modelo da OpenAI argumentaram contra a pena de morte, que, segundo o instituto Gallup, é apoiada de forma consistente pela maioria dos americanos há décadas. Esse contraste entre a posição dos modelos e a opinião pública majoritária ilustra bem como o viés pode escapar até de temas onde existe um consenso social relativamente claro.
O Gemini, do Google, se saiu de forma bastante diferente nesse comparativo. Ele foi o único modelo a apresentar os dois lados do debate em mais de 90% das respostas, o que o coloca em destaque quando o critério é equilíbrio político. Ele chegou a oferecer argumentos dos dois lados até em uma pergunta sobre se os Estados Unidos deveriam usar seu poder militar para conquistar novos territórios em busca de recursos. Nenhum outro modelo apresentou um argumento favorável à conquista. Isso não quer dizer que o Gemini seja perfeito ou completamente livre de bias, mas sugere que o Google adotou estratégias de alinhamento diferentes, investindo mais em técnicas que forçam o modelo a apresentar perspectivas múltiplas antes de encerrar uma resposta sobre temas sensíveis.
E aí vem o dado que talvez seja o mais curioso de todos: o Grok, da xAI de Elon Musk, frequentemente posicionado no mercado como uma alternativa anti-woke aos outros chatbots, deu mais respostas de direita do que qualquer outro modelo no teste, mas, na maioria das vezes, ainda assim ofereceu uma posição inteiramente de esquerda. Esse resultado é especialmente significativo porque contraria diretamente o marketing do produto. Musk tem sido bastante vocal sobre o que ele chama de viés de esquerda nos sistemas concorrentes, e o Grok foi criado, em parte, como resposta a essa percepção. Ver o modelo apresentar um padrão semelhante ao que ele critica é, no mínimo, um dado que merece reflexão sobre quão difícil é, na prática, construir um sistema verdadeiramente neutro em temas politicamente carregados 🤔
Curiosamente, a rede social de direita Gab oferece um modelo chamado Arya, descrito como construído com valores cristãos e princípios conservadores. Ainda assim, nos testes do Washington Post, ele respondeu com um argumento de esquerda 12 vezes mais do que com um argumento de direita.
O que as empresas responderam
Diante dos resultados, as empresas envolvidas foram questionadas, e as respostas seguiram um padrão familiar nesse tipo de situação. A porta-voz do Google, Lauren Fine, afirmou que o Gemini foi projetado para fornecer respostas equilibradas que não favoreçam nenhuma ideologia política, e que a empresa não conseguiu reproduzir as respostas unilaterais que apareceram nos testes do jornal.
O porta-voz da Anthropic, Michael Aciman, disse que a empresa treina o Claude para tratar diferentes pontos de vista políticos de forma igual e que testa exaustivamente o viés antes de cada lançamento de modelo. Segundo ele, os testes do Post não refletem como a maioria das pessoas usa os produtos da empresa, já que o Claude geralmente tem mais espaço para incluir contexto ao discutir política.
A OpenAI, por meio da porta-voz Liz Bourgeois, afirmou que o ChatGPT foi construído para ser objetivo por padrão e ajudar as pessoas a explorar ideias de diferentes perspectivas, e que a empresa trabalha para medir e reduzir o viés político. A OpenAI também disse que não conseguiu replicar os achados do estudo. Já SpaceX, DeepSeek e Gab não responderam aos pedidos de comentário. Vale lembrar que o próprio CEO da OpenAI, Sam Altman, já havia dito em 2023 que a empresa tentaria deixar a versão padrão do ChatGPT o mais neutra possível, mas que a solução passa pela personalização, porque a palavra neutro significa coisas diferentes para pessoas diferentes.
Por que a neutralidade total em IA é quase impossível
Entender por que os chatbots têm bias político exige entender como esses sistemas são construídos. Modelos de linguagem de grande escala, os chamados LLMs, são treinados em volumes gigantescos de texto coletado da internet, de livros, artigos, fóruns e outras fontes. As empresas escolhem quais dados incluir, e esse conjunto reflete o mundo como ele é, com todas as suas contradições e inclinações culturais. Quando um modelo aprende a partir desse material, ele inevitavelmente absorve os padrões presentes nele, incluindo os padrões políticos. Não existe um corpus de treinamento politicamente neutro porque o próprio conteúdo humano não é neutro.
Além do treinamento inicial, os modelos passam por um processo de ajuste fino com feedback humano, onde avaliadores indicam quais respostas são melhores ou piores. As empresas também escrevem instruções de sistema que guiam o comportamento dos chatbots. Esse processo, por mais bem-intencionado que seja, introduz mais uma camada de subjetividade, porque os avaliadores também têm opiniões e inclinações próprias. Ceren Budak, professora da Universidade de Michigan que estuda como tecnologias interagem com a polarização política, observa que os dados que moldam os modelos de IA tendem a refletir os valores de pessoas ocidentais, educadas, industrializadas, ricas e democráticas. Para ela, seria útil ter mais clareza sobre os sistemas de valores atuais das empresas, para que os usuários saibam o que estão usando.
Budak também destaca um ponto importante: com a IA, as empresas de tecnologia estão assumindo um papel mais ativo, porque os produtos geram discurso político diretamente, em vez de apenas curar o discurso de humanos, como fazem as redes sociais. Mesmo quem nunca conversa com chatbots sobre política acaba exposto a textos gerados por IA em conteúdos online e em outros canais.
As tendências mais recentes na área de alinhamento de IA tentam endereçar esse problema por meio de técnicas que forçam o modelo a apresentar múltiplas perspectivas em tópicos controversos. O resultado do Gemini neste estudo sugere que essas abordagens podem funcionar até certo ponto, mas ainda há muito terreno a percorrer. Andrew Hall, pesquisador de Stanford que participou do estudo original, disse ter se surpreendido por nem todos os principais chatbots responderem de forma tão neutra quanto o Gemini, esperando que os demais modelos já tivessem alcançado esse patamar. Muitos estudiosos argumentam que a neutralidade política é, na verdade, impossível, já que até posições de meio-termo são posições em si, e tendem a beneficiar o lado mais forte. Por essa lógica, a abordagem dos dois lados do Google é, ela própria, uma escolha política. A questão fundamental é que definir o que é neutro já é, em si, um ato político 🤖
O impacto dessa discussão no futuro da IA
O debate sobre bias político em chatbots não vai desaparecer. Na verdade, tudo indica que vai se intensificar nos próximos meses e anos, à medida que esses sistemas se tornam cada vez mais presentes no cotidiano. Poucos americanos usam a IA diretamente para entender política, mas, segundo uma pesquisa de março do Polarization Research Lab, quase metade usa IA ocasionalmente para acompanhar notícias. Quando milhões de pessoas recorrem a um chatbot para obter informações, o viés desse sistema tem um potencial de influência que vai além de qualquer veículo de mídia tradicional, simplesmente porque a escala é incomparável e a interação é personalizada, criando uma sensação de confiança difícil de questionar.
Hall, de Stanford, também lembra que as empresas de IA precisam lidar com categorias diferentes de perguntas. Algumas são objetivas e factuais, como qual é a velocidade da luz, que os chatbots respondem com facilidade. Mas a maioria das questões políticas não tem essa característica, já que não existe uma verdade única. É preciso pegar os fatos e adicionar valores sobre eles, e é aí que mora a dificuldade. Westwood, de Dartmouth, observa que tanto democratas quanto republicanos não confiam na IA para ser neutra e a mantêm distante de suas decisões de voto, sendo este um dos poucos pontos em que os dois lados concordam no atual cenário político.
A ordem executiva de Trump, independentemente do que se pense sobre ela, colocou o dedo numa ferida real e trouxe à tona uma conversa que a indústria de tecnologia precisava ter de forma mais aberta. As empresas que desenvolvem esses sistemas têm uma responsabilidade significativa em relação à forma como seus modelos se comportam em contextos políticos, e estudos como o conduzido pelo Washington Post com pesquisadores de Dartmouth e Stanford são ferramentas importantes para manter essa responsabilidade visível e auditável.
O que fica claro depois de analisar todos esses dados é que a discussão sobre tendências políticas em sistemas de inteligência artificial não é uma questão simples de resolver com uma atualização de software ou uma declaração corporativa bem elaborada. Ela exige um esforço contínuo, multidisciplinar e honesto por parte de quem desenvolve essas tecnologias, e uma postura crítica e informada por parte de quem as utiliza. Os chatbots são ferramentas extraordinariamente poderosas, e entender suas limitações politicamente é tão importante quanto aproveitar suas capacidades. Afinal, uma IA que parece neutra mas não é pode ser mais perigosa do que uma que assume abertamente suas limitações 💡
