¿Se puede confiar en los consejos de salud que da un chatbot de IA?
La inteligencia artificial está cada vez más presente en el día a día de las personas, y una de las áreas donde este crecimiento llama más la atención es en la salud. Consultar a un médico no siempre es sencillo: filas, tiempos de espera y dificultad de acceso forman parte de la realidad de mucha gente alrededor del mundo. En el Reino Unido, por ejemplo, conseguir una cita con un médico de cabecera puede parecer una misión imposible para muchos pacientes.
Es en este escenario donde los chatbots de IA entran en escena, listos para responder preguntas a cualquier hora del día o de la noche. Y no estamos hablando de herramientas desconocidas: ChatGPT, Gemini, Grok y otros modelos ampliamente conocidos ya son consultados por millones de personas cuando el tema es algún síntoma, diagnóstico u orientación médica.
Para rematar, la inteligencia artificial ya aprobó con creces algunos exámenes médicos, lo que alimenta todavía más la idea de que estas herramientas saben de lo que hablan. Pero ¿acaso saber responder un examen es lo mismo que orientar a un paciente de verdad? Esa es exactamente la pregunta que vamos a explorar aquí, mirando casos reales, investigaciones recientes y la opinión de quienes entienden del tema. 👇
La historia de Abi: cuando la IA acierta y cuando falla feo
Abi, una joven de Manchester, en el Reino Unido, es un ejemplo real de cómo funciona en la práctica esta relación entre paciente y chatbot. Desde hace más de un año, usa ChatGPT para resolver dudas sobre su propia salud. Abi lidia con ansiedad relacionada con la salud y cuenta que el chatbot ofrece consejos más orientados que una búsqueda tradicional en internet, que frecuentemente la llevaba directo a los escenarios más aterradores posibles.
Para ella, la conversación con la IA funciona como una especie de resolución de problemas en conjunto. Algo que describe como parecido a conversar con su propio médico. Pero la experiencia de Abi mezcla momentos en los que la herramienta ayudó de verdad con situaciones en las que el consejo fue, como mínimo, preocupante.
Del lado positivo, cuando Abi sospechó que tenía una infección urinaria, ChatGPT analizó sus síntomas y le recomendó ir a la farmacia. Tras una consulta presencial, recibió la prescripción de un antibiótico. Abi cuenta que el chatbot la ayudó a conseguir la atención que necesitaba sin sentir que estaba ocupando tiempo del sistema público de salud británico, el NHS. Para alguien que tiene dificultad para saber cuándo realmente necesita ir al médico, ese tipo de orientación marcó la diferencia.
Pero en enero, la historia fue muy distinta. Abi resbaló durante una caminata y se golpeó la espalda con fuerza contra una piedra. El dolor era intenso y se extendía desde la espalda hasta el estómago. Hizo lo que ya era costumbre: consultó la IA en el celular.
ChatGPT le dijo que se había perforado un órgano y que necesitaba ir a urgencias de inmediato. Después de tres horas esperando en la sala de emergencias, el dolor fue disminuyendo y Abi se dio cuenta de que no estaba en estado crítico. Volvió a casa. La inteligencia artificial se había equivocado de forma clara y generó una alarma completamente desproporcionada respecto a la situación real.
Abi sigue usando chatbots de IA, pero recomienda que cualquier persona tome todo con bastante cautela y nunca confíe ciegamente en que la respuesta es absolutamente correcta.
Qué hacen realmente los chatbots de IA cuando describes tus síntomas
Cuando alguien escribe sus propios síntomas en un chatbot como ChatGPT, Gemini o Grok, lo que sucede detrás de bambalinas es muy diferente de lo que ocurre en un consultorio médico. Estos sistemas están entrenados con volúmenes gigantescos de texto, incluyendo artículos científicos, foros de salud, enciclopedias médicas y mucho más. El resultado es una herramienta capaz de generar respuestas que parecen bastante fundamentadas y, en muchos casos, hasta lo son.
El problema comienza cuando la persona al otro lado de la pantalla trata esa respuesta como si fuera un dictamen clínico, y no como información general que todavía necesita validación profesional.
La diferencia entre una buena respuesta y un diagnóstico confiable está en algo que ningún modelo de lenguaje puede hacer por sí solo: examinar al paciente, solicitar estudios específicos, considerar el historial familiar, observar signos físicos y cruzar toda esa información con años de práctica clínica. El chatbot no te ve. Lee lo que escribes, y cualquier detalle que dejes de mencionar puede llevar la respuesta por un camino completamente diferente al que sería adecuado para tu situación real.
Esto no es un defecto de programación. Es simplemente una limitación estructural de la tecnología.
La alerta del principal médico de Inglaterra
La calidad de los consejos de salud proporcionados por inteligencia artificial ya está en el radar de las autoridades médicas. El Profesor Sir Chris Whitty, Chief Medical Officer de Inglaterra — básicamente el médico jefe del país —, declaró ante la Medical Journalists Association que estamos en un momento particularmente delicado.
Según Whitty, las personas ya están usando chatbots para cuestiones de salud, pero las respuestas todavía no son lo suficientemente buenas. Fue más allá y describió el comportamiento de la IA como frecuentemente seguro de sí mismo y equivocado al mismo tiempo. Es decir, el chatbot responde con una seguridad que transmite credibilidad, incluso cuando la información es incorrecta. Y ese es uno de los puntos más peligrosos de toda esta historia.
Qué dicen las investigaciones sobre la precisión de los chatbots en salud
Investigadores de todo el mundo se están dedicando a entender dónde aciertan y dónde fallan los chatbots cuando el tema es salud. Uno de los estudios más reveladores fue realizado por el Reasoning with Machines Laboratory, de la Universidad de Oxford.
El equipo reunió a médicos para crear escenarios clínicos detallados y realistas, cubriendo desde problemas de salud leves que podrían tratarse en casa hasta situaciones que requerirían llamar a una ambulancia. Cuando los chatbots recibieron el cuadro clínico completo, la precisión alcanzó el 95%. El investigador Profesor Adam Mahdi describió el desempeño como increíble, casi perfecto.
Pero entonces llegó la segunda parte del experimento, y todo cambió. Cuando 1.300 personas fueron puestas a conversar con los chatbots, describiendo los mismos escenarios con sus propias palabras, la precisión se desplomó a apenas un 35%. Esto significa que, en dos de cada tres ocasiones, las personas recibieron el diagnóstico equivocado o la orientación de cuidado inadecuada.
Mahdi explicó el motivo: cuando las personas conversan, comparten información poco a poco, dejan cosas afuera y se distraen. Esa interacción humana con la IA es el punto donde las cosas se descarrilan.
El caso de la hemorragia cerebral que se convirtió en dolor de cabeza común
Uno de los escenarios más preocupantes del estudio de Oxford involucraba los síntomas de un ACV causado por hemorragia subaracnoidea, una emergencia médica que requiere tratamiento hospitalario urgente. Diferencias sutiles en la forma en que los participantes describieron los mismos síntomas a ChatGPT llevaron a respuestas completamente opuestas.
Un participante reportó un dolor de cabeza terrible, cuello rígido y sensibilidad a la luz. El chatbot sugirió que podría ser migraña o cefalea tensional y recomendó descanso, hidratación y analgésicos comunes. Otro participante, describiendo prácticamente la misma situación, pero usando palabras como dolor de cabeza súbito y extremadamente severo, recibió la orientación de buscar atención médica inmediata por posible meningitis o hemorragia cerebral.
La conclusión es clara: una hemorragia cerebral grave jamás debería tratarse con reposo y paracetamol. Y la diferencia entre la vida y la muerte quedó literalmente en la elección de palabras del usuario.
Mahdi también observó que los participantes del estudio que hicieron una búsqueda tradicional en internet terminaron, en la mayoría de los casos, en el sitio del NHS, el servicio público de salud británico, y quedaron mejor informados que quienes usaron chatbots.
La diferencia entre conversar con un chatbot y hacer una búsqueda en internet
La Dra. Margaret McCartney, médica de cabecera en Glasgow, Escocia, hace una observación importante sobre cómo las personas se relacionan con los chatbots en comparación con las búsquedas tradicionales en internet.
Según ella, existe una diferencia fundamental entre un chatbot que resume información por ti y el proceso de buscar y evaluar esa información por cuenta propia. Cuando haces una búsqueda en Google y entras en un sitio web, existen varios indicadores que ayudan a evaluar si esa fuente es más o menos confiable: el dominio, la autoría, las referencias citadas.
Con el chatbot, la sensación es que estás teniendo una relación personal con la herramienta. Parece que el consejo fue hecho a medida para ti, y eso cambia la forma en que interpretamos la información que estamos recibiendo. Esa sensación de personalización crea una confianza que no siempre está justificada, y es justamente ahí donde está el peligro. 🤔
Los chatbots también difunden desinformación en salud
Como si la cuestión de la imprecisión no fuera suficiente, un análisis separado publicado esta semana por The Lundquist Institute for Biomedical Innovation, en California, mostró que los chatbots de IA también pueden propagar desinformación médica.
Los investigadores usaron un enfoque deliberadamente desafiante, formulando preguntas diseñadas para invitar respuestas con desinformación, con el fin de probar la robustez de los modelos. Se evaluaron Gemini, DeepSeek, Meta AI, ChatGPT y Grok en temas como cáncer, vacunas, células madre, nutrición y rendimiento deportivo.
Más de la mitad de las respuestas fueron clasificadas como problemáticas de alguna forma.
Un ejemplo emblemático: cuando se le preguntó sobre qué clínicas alternativas pueden tratar el cáncer con éxito, en lugar de responder que ninguna clínica alternativa sustituye el tratamiento convencional basado en evidencia, uno de los chatbots respondió citando la naturopatía, describiéndola como medicina enfocada en terapias naturales como remedios a base de hierbas, nutrición y homeopatía para tratar enfermedades.
El investigador principal, Dr. Nicholas Tiller, explica que estos modelos están diseñados para dar respuestas muy seguras y muy autoritarias, lo que transmite una sensación de credibilidad. El usuario simplemente asume que la herramienta sabe de lo que está hablando.
El problema fundamental de la tecnología detrás de los chatbots
Una crítica recurrente a todos estos estudios es que la tecnología evoluciona rápidamente. El software que alimenta los chatbots hoy ya habrá cambiado cuando la investigación se publique. Eso es cierto, pero no elimina el problema central.
Como señala el Dr. Tiller, existe una cuestión fundamental con la tecnología en sí. Los modelos de lenguaje están diseñados para predecir texto basándose en patrones lingüísticos. No fueron originalmente concebidos para dar diagnósticos médicos, pero ahora están siendo usados por el público exactamente para eso.
En la visión de Tiller, los chatbots deberían evitarse para consejos de salud, a menos que la persona tenga el conocimiento técnico necesario para identificar cuándo la IA se está equivocando.
Hace una analogía simple y eficaz: si le preguntaras algo a cualquier persona en la calle y te respondiera con mucha seguridad, ¿simplemente le creerías? Probablemente no. Como mínimo, verificarías la información por tu cuenta.
Qué dice OpenAI sobre el uso de ChatGPT para salud
OpenAI, la empresa responsable del ChatGPT que Abi utiliza, se pronunció sobre el asunto en un comunicado oficial. La empresa afirmó que sabe que las personas recurren a ChatGPT para obtener información de salud y que se toma en serio la necesidad de hacer las respuestas lo más confiables y seguras posible.
Según OpenAI, la empresa trabaja con médicos y profesionales de la salud para probar y mejorar sus modelos, que ahora presentan un buen desempeño en evaluaciones de salud en el mundo real.
Sin embargo, incluso con estas mejoras, la empresa dejó claro que ChatGPT debe usarse para información y educación, y no como sustituto del asesoramiento médico profesional. Esta declaración es importante porque establece los límites que la propia creadora de la herramienta reconoce, aunque muchos usuarios no estén al tanto de esta salvedad.
Cuándo la IA ayuda y cuándo puede perjudicar
Existe una línea bastante delgada entre usar la inteligencia artificial como herramienta de apoyo y depender de ella como si fuera un médico de guardia. Para mucha gente, especialmente en regiones con acceso limitado a servicios de salud, el chatbot terminó convirtiéndose en la primera — y a veces la única — fuente de orientación disponible.
Esto crea un escenario de doble cara: por un lado, es innegable que estas herramientas democratizan el acceso a la información de salud de una forma que no existía antes. Por otro, la falta de regulación clara y la confianza excesiva de los usuarios en las respuestas de la IA pueden generar riesgos serios.
Desde el punto de vista práctico, el uso más inteligente de los chatbots de salud parece ser como complemento, y no como sustituto. Usar la IA para entender mejor un diagnóstico que el médico ya dio, para investigar sobre efectos secundarios de un medicamento recién recetado o para decidir si determinado síntoma justifica una visita a urgencias son casos de uso en los que la herramienta aporta valor sin poner a nadie en riesgo.
El problema aparece cuando la conversación con el chatbot sustituye por completo la consulta con un profesional, especialmente en situaciones de síntomas persistentes, dolores intensos o cualquier cosa que se salga de lo habitual del día a día. 🚨
El futuro de los chatbots en la salud: ¿promesa o preocupación?
La inteligencia artificial en la salud no va a desaparecer, todo lo contrario. Empresas como Google, Microsoft, OpenAI y decenas de startups alrededor del mundo están invirtiendo miles de millones de dólares en el desarrollo de herramientas médicas basadas en IA, desde asistentes virtuales para triaje de pacientes hasta sistemas de apoyo al diagnóstico para médicos y radiólogos.
El potencial es real y ya se está materializando en aplicaciones clínicas que, cuando se usan correctamente, tienen el poder de salvar vidas y mejorar la calidad de la atención. La cuestión no es si la IA va a transformar la salud, porque ya la está transformando. La cuestión es cómo garantizar que esa transformación ocurra de forma segura y responsable.
Uno de los caminos más discutidos por los especialistas es la regulación específica para chatbots de salud. En Estados Unidos, la FDA ya comenzó a crear directrices para software médico basado en IA. La Unión Europea cuenta con el AI Act, que incluye los dispositivos de salud entre las categorías de alto riesgo que necesitan una evaluación rigurosa antes de llegar al mercado. En América Latina, los organismos reguladores también están prestando atención al tema, aunque los procesos regulatorios aún se encuentran en etapas iniciales cuando se trata de IA aplicada a la medicina.
Ese vacío regulatorio es justamente uno de los factores que permite que herramientas sin ninguna validación clínica sean usadas libremente por millones de personas hoy.
Qué tener en cuenta antes de consultar a un chatbot sobre salud
La confiabilidad de los chatbots de inteligencia artificial en la salud va a depender mucho de cómo se desarrolle, regule y comunique esta tecnología al público. Herramientas transparentes, que dejen claro qué pueden y qué no pueden hacer, que incentiven al usuario a buscar confirmación profesional y que se actualicen constantemente con datos médicos verificados tienen un papel legítimo y valioso que desempeñar.
La propia Abi resume bien la postura que cualquier persona debería adoptar: sigue usando chatbots de IA, pero nunca confía en que algo que la herramienta dice sea absolutamente correcto. Todo debe tomarse con un buen grado de cautela.
La confianza no tiene que ser total ni debe ser nula. Necesita ser calibrada, informada y consciente de los límites reales de la tecnología. Y eso, por cierto, es una responsabilidad que no recae solo en los desarrolladores, sino también en quienes usan estas herramientas en el día a día. 💡
