Los chatbots de inteligencia artificial están en el centro de una polémica que mezcla tecnología y política de una forma que pocos esperaban.
Cuando el presidente Donald Trump firmó una orden ejecutiva determinando que las IAs sean herramientas neutrales y apartidistas, el debate sobre el sesgo político de estas tecnologías salió del terreno de la especulación y se convirtió en una cuestión concreta, urgente y con implicaciones reales para millones de personas. La medida también generó reacciones del lado demócrata, que empezó a temer que la IA pudiera inclinarse hacia la derecha por presión política.
Pero, ¿realmente los chatbots tienen sesgo político?
El Washington Post decidió ir más allá de la polémica y poner esta pregunta a prueba de verdad, evaluando los principales modelos de IA disponibles hoy con preguntas políticas calibradas por investigadores de universidades como Dartmouth y Stanford. Se evaluaron los modelos detrás de ChatGPT, de OpenAI, de Gemini, de Google, además de Anthropic, DeepSeek, xAI y Gab.
Los resultados fueron, como mínimo, sorprendentes 👀
Entre los hallazgos más llamativos, el modelo detrás de ChatGPT respondió casi todas las preguntas únicamente con argumentos de izquierda, presentando una posición de derecha una sola vez, totalizando cerca del 80% de las respuestas con inclinación progresista. Por su parte, Gemini, de Google, fue el único en presentar ambos lados en más del 90% de las respuestas.
Y hay más: hasta Grok, de la xAI de Elon Musk, que se comercializa como una alternativa anti-woke y orientada a la búsqueda de la verdad, también citó más argumentos progresistas en el promedio general.
En este artículo vas a entender cómo se realizó la prueba, qué revelan los números sobre cada modelo, qué dijeron las empresas sobre los resultados y por qué la neutralidad total en IA puede ser, en la práctica, una ilusión difícil de alcanzar 🤖
Cómo se realizó la prueba
La metodología detrás de la investigación del Washington Post no fue improvisada. El periódico se basó en una investigación publicada el año pasado por el laboratorio de Sean Westwood, director del Polarization Research Lab de Dartmouth College, en colaboración con investigadores de la Universidad de Stanford. Ese estudio desarrolló más de dos docenas de preguntas políticas pensadas para reflejar el tipo de cuestión que personas comunes podrían hacerle a un chatbot.
Cada modelo fue solicitado para responder las preguntas en un máximo de 30 palabras, sin configuraciones de personalización activadas. Un reportero revisó las respuestas para clasificar si contenían una posición de izquierda, una posición de derecha o ambas. Los temas políticos rara vez se dividen de forma limpia entre partidos, pero las preguntas cubrieron una amplia gama de asuntos, y el periódico verificó si los modelos eran consistentes en sus respuestas, repitiendo cada pregunta cinco veces para garantizar la confiabilidad de los datos.
Este tipo de análisis cuantitativo y cualitativo combinado es lo que le da peso científico a los resultados y los hace difíciles de ignorar, independientemente del lado político del lector. Según Westwood, entender las posiciones que estas herramientas amplifican es importante porque se están volviendo cada vez más influyentes, a medida que más personas las usan para comprender el mundo y los eventos noticiosos. Como él resumió, estas herramientas de IA no están presentando, en promedio, una representación verdaderamente neutral de debates políticos llenos de matices.
Vale destacar que este tipo de estudio no es una novedad absoluta en el campo de la investigación sobre sesgo en inteligencia artificial. Varios estudios académicos anteriores ya habían encontrado que los modelos de IA tienden a favorecer posiciones de izquierda. Pero el momento de esta investigación específica ganó peso adicional por el contexto político en Estados Unidos. Con la orden ejecutiva de Trump colocando el tema en la agenda pública y empresas de tecnología siendo presionadas a posicionarse, los datos levantados por el Washington Post llegaron en un momento en que la discusión sobre tendencias políticas en sistemas de IA ya no es un debate restringido a académicos o entusiastas. Es una conversación que llegó al mainstream.
Qué revelan los números sobre cada modelo
El resultado que más llamó la atención fue el del modelo detrás de ChatGPT, desarrollado por OpenAI, que dio las respuestas más sesgadas de todos. Cerca del 80% de ellas presentaron únicamente argumentos de izquierda. El modelo defendió, por ejemplo, abolir el colegio electoral a favor de elegir al presidente por voto popular, aumentar impuestos a los más ricos y adoptar un sistema de salud de pagador único. Esto no significa necesariamente que el modelo fue programado para defender una ideología específica, pero indica que los datos de entrenamiento, combinados con las decisiones de ajuste fino de OpenAI, resultaron en un patrón de respuesta que se inclina hacia una dirección. Este es exactamente el tipo de sesgo que preocupa a los investigadores, porque actúa de forma sutil, muchas veces invisible para el usuario común que recibe una respuesta y la acepta como neutral.
La IA de la empresa china DeepSeek quedó justo detrás y también se inclinó hacia la izquierda en sus respuestas. Tanto ella como el modelo de OpenAI argumentaron en contra de la pena de muerte, que, según el instituto Gallup, es apoyada de forma consistente por la mayoría de los estadounidenses desde hace décadas. Este contraste entre la posición de los modelos y la opinión pública mayoritaria ilustra bien cómo el sesgo puede escapar incluso en temas donde existe un consenso social relativamente claro.
Gemini, de Google, se desempeñó de forma bastante diferente en esta comparación. Fue el único modelo en presentar ambos lados del debate en más del 90% de las respuestas, lo que lo destaca cuando el criterio es equilibrio político. Llegó a ofrecer argumentos de los dos lados incluso en una pregunta sobre si Estados Unidos debería usar su poder militar para conquistar nuevos territorios en busca de recursos. Ningún otro modelo presentó un argumento a favor de la conquista. Esto no quiere decir que Gemini sea perfecto o completamente libre de sesgo, pero sugiere que Google adoptó estrategias de alineamiento diferentes, invirtiendo más en técnicas que obligan al modelo a presentar perspectivas múltiples antes de cerrar una respuesta sobre temas sensibles.
Y aquí viene el dato que quizás sea el más curioso de todos: Grok, de la xAI de Elon Musk, frecuentemente posicionado en el mercado como una alternativa anti-woke a los otros chatbots, dio más respuestas de derecha que cualquier otro modelo en la prueba, pero, la mayoría de las veces, aún así ofreció una posición enteramente de izquierda. Este resultado es especialmente significativo porque contradice directamente el marketing del producto. Musk ha sido bastante vocal sobre lo que él llama sesgo de izquierda en los sistemas competidores, y Grok fue creado, en parte, como respuesta a esa percepción. Ver al modelo presentar un patrón similar al que critica es, como mínimo, un dato que merece reflexión sobre lo difícil que es, en la práctica, construir un sistema verdaderamente neutral en temas políticamente cargados 🤔
Curiosamente, la red social de derecha Gab ofrece un modelo llamado Arya, descrito como construido con valores cristianos y principios conservadores. Aun así, en las pruebas del Washington Post, respondió con un argumento de izquierda 12 veces más que con un argumento de derecha.
Qué respondieron las empresas
Ante los resultados, las empresas involucradas fueron consultadas, y las respuestas siguieron un patrón familiar en este tipo de situación. La portavoz de Google, Lauren Fine, afirmó que Gemini fue diseñado para proporcionar respuestas equilibradas que no favorezcan ninguna ideología política, y que la empresa no pudo reproducir las respuestas unilaterales que aparecieron en las pruebas del periódico.
El portavoz de Anthropic, Michael Aciman, dijo que la empresa entrena a Claude para tratar diferentes puntos de vista políticos de forma igual y que prueba exhaustivamente el sesgo antes de cada lanzamiento de modelo. Según él, las pruebas del Post no reflejan cómo la mayoría de las personas usa los productos de la empresa, ya que Claude generalmente tiene más espacio para incluir contexto al discutir política.
OpenAI, a través de la portavoz Liz Bourgeois, afirmó que ChatGPT fue construido para ser objetivo por defecto y ayudar a las personas a explorar ideas desde diferentes perspectivas, y que la empresa trabaja para medir y reducir el sesgo político. OpenAI también dijo que no pudo replicar los hallazgos del estudio. Por su parte, SpaceX, DeepSeek y Gab no respondieron a las solicitudes de comentario. Vale recordar que el propio CEO de OpenAI, Sam Altman, ya había dicho en 2023 que la empresa intentaría hacer la versión estándar de ChatGPT lo más neutral posible, pero que la solución pasa por la personalización, porque la palabra neutral significa cosas diferentes para personas diferentes.
Por qué la neutralidad total en IA es casi imposible
Entender por qué los chatbots tienen sesgo político exige entender cómo se construyen estos sistemas. Los modelos de lenguaje de gran escala, los llamados LLMs, se entrenan con volúmenes gigantescos de texto recopilado de internet, libros, artículos, foros y otras fuentes. Las empresas eligen qué datos incluir, y ese conjunto refleja el mundo tal como es, con todas sus contradicciones e inclinaciones culturales. Cuando un modelo aprende a partir de ese material, inevitablemente absorbe los patrones presentes en él, incluidos los patrones políticos. No existe un corpus de entrenamiento políticamente neutral porque el propio contenido humano no es neutral.
Además del entrenamiento inicial, los modelos pasan por un proceso de ajuste fino con retroalimentación humana, donde evaluadores indican qué respuestas son mejores o peores. Las empresas también escriben instrucciones de sistema que guían el comportamiento de los chatbots. Este proceso, por más bienintencionado que sea, introduce una capa más de subjetividad, porque los evaluadores también tienen opiniones e inclinaciones propias. Ceren Budak, profesora de la Universidad de Michigan que estudia cómo las tecnologías interactúan con la polarización política, observa que los datos que moldean los modelos de IA tienden a reflejar los valores de personas occidentales, educadas, industrializadas, ricas y democráticas. Para ella, sería útil tener más claridad sobre los sistemas de valores actuales de las empresas, para que los usuarios sepan qué están usando.
Budak también destaca un punto importante: con la IA, las empresas de tecnología están asumiendo un papel más activo, porque los productos generan discurso político directamente, en lugar de solo curar el discurso de humanos, como hacen las redes sociales. Incluso quienes nunca conversan con chatbots sobre política terminan expuestos a textos generados por IA en contenidos online y en otros canales.
Las tendencias más recientes en el área de alineamiento de IA intentan abordar este problema mediante técnicas que obligan al modelo a presentar múltiples perspectivas en temas controversiales. El resultado de Gemini en este estudio sugiere que estos enfoques pueden funcionar hasta cierto punto, pero todavía hay mucho camino por recorrer. Andrew Hall, investigador de Stanford que participó en el estudio original, dijo haberse sorprendido de que no todos los principales chatbots respondieran de forma tan neutral como Gemini, esperando que los demás modelos ya hubieran alcanzado ese nivel. Muchos estudiosos argumentan que la neutralidad política es, en realidad, imposible, ya que hasta las posiciones de centro son posiciones en sí mismas, y tienden a beneficiar al lado más fuerte. Bajo esa lógica, el enfoque de los dos lados de Google es, en sí mismo, una elección política. La cuestión fundamental es que definir qué es neutral ya es, en sí, un acto político 🤖
El impacto de esta discusión en el futuro de la IA
El debate sobre sesgo político en chatbots no va a desaparecer. De hecho, todo indica que se intensificará en los próximos meses y años, a medida que estos sistemas se vuelvan cada vez más presentes en la vida cotidiana. Pocos estadounidenses usan la IA directamente para entender política, pero, según una encuesta de marzo del Polarization Research Lab, casi la mitad usa IA ocasionalmente para seguir noticias. Cuando millones de personas recurren a un chatbot para obtener información, el sesgo de ese sistema tiene un potencial de influencia que va más allá de cualquier medio de comunicación tradicional, simplemente porque la escala es incomparable y la interacción es personalizada, creando una sensación de confianza difícil de cuestionar.
Hall, de Stanford, también recuerda que las empresas de IA necesitan lidiar con categorías diferentes de preguntas. Algunas son objetivas y factuales, como cuál es la velocidad de la luz, que los chatbots responden con facilidad. Pero la mayoría de las cuestiones políticas no tienen esa característica, ya que no existe una verdad única. Es necesario tomar los hechos y añadir valores sobre ellos, y ahí es donde está la dificultad. Westwood, de Dartmouth, observa que tanto demócratas como republicanos no confían en la IA para ser neutral y la mantienen alejada de sus decisiones de voto, siendo este uno de los pocos puntos en los que ambos lados coinciden en el actual escenario político.
La orden ejecutiva de Trump, independientemente de lo que se piense de ella, puso el dedo en una llaga real y sacó a la luz una conversación que la industria tecnológica necesitaba tener de forma más abierta. Las empresas que desarrollan estos sistemas tienen una responsabilidad significativa respecto a la forma en que sus modelos se comportan en contextos políticos, y estudios como el realizado por el Washington Post con investigadores de Dartmouth y Stanford son herramientas importantes para mantener esa responsabilidad visible y auditable.
Lo que queda claro después de analizar todos estos datos es que la discusión sobre tendencias políticas en sistemas de inteligencia artificial no es una cuestión sencilla de resolver con una actualización de software o una declaración corporativa bien elaborada. Exige un esfuerzo continuo, multidisciplinario y honesto por parte de quienes desarrollan estas tecnologías, y una postura crítica e informada por parte de quienes las utilizan. Los chatbots son herramientas extraordinariamente poderosas, y entender sus limitaciones políticamente es tan importante como aprovechar sus capacidades. Al fin y al cabo, una IA que parece neutral pero no lo es puede ser más peligrosa que una que asume abiertamente sus limitaciones 💡
