El primer smartphone con IA agéntica llegó — y trajo un problema enorme
El Doubao Phone surgió como el primer smartphone del planeta en integrar un agente de IA directamente en el sistema operativo, y desde su lanzamiento en China, en diciembre de 2025, el dispositivo ha provocado debates intensos en el mercado tecnológico global. Fruto de una alianza entre ByteDance y ZTE — también conocido como Nubia M153 —, el dispositivo propone algo que parecía ficción hasta hace poco: un asistente inteligente que opera de forma autónoma, capaz de reservar restaurantes, comprar entradas, agendar compromisos e hasta realizar pagos sin que el usuario necesite navegar por varias aplicaciones diferentes. La propuesta es eliminar esa fricción de estar alternando entre apps para completar tareas simples del día a día, algo que cualquier persona que usa smartphone conoce bien.
Pero toda esa conveniencia llegó acompañada de una polémica que nadie esperaba — o mejor dicho, que quizá todo el mundo debería haber previsto. A los pocos días del lanzamiento, algunas de las mayores aplicaciones de China, como WeChat, Alipay y Taobao, simplemente bloquearon el funcionamiento del Doubao Phone en sus plataformas. El motivo es tan fascinante como aterrador: el agente de Inteligencia Artificial integrado en el dispositivo tiene acceso total a la pantalla del aparato, puede leer el contenido de todas las apps instaladas e interactúa con ellas como si fuera el propio dueño del celular. Críticos llegaron a llamar al agente un verdadero intruso digital con las puntas de los dedos de dios — una referencia a la capacidad que tiene de tocar y hacer clic en cualquier cosa de la pantalla sin distinción entre acciones humanas y automatizadas.
Para bancos y plataformas de pago, resultó prácticamente imposible distinguir si quien estaba realizando una transacción era la persona real o la IA actuando en su nombre. WeChat, la superapp más esencial de la vida digital china — que funciona como una combinación de WhatsApp, Facebook, Uber, Amazon y app bancaria en una única interfaz —, activó sus controles de seguridad de alto riesgo y cortó el acceso del Doubao Phone. La decisión puso a dos de las mayores potencias del internet chino, Tencent y ByteDance, en ruta directa de colisión.
La situación escaló aún más cuando un video se viralizó en Little RedNote — una especie de Instagram chino — mostrando el saldo bancario de un usuario expuesto no solo en el propio Doubao Phone, sino en un espejo de él en otros dispositivos donde la cuenta de Doubao AI también estaba conectada. Otros videos se difundieron por la plataforma, con usuarios experimentando y descubriendo que datos financieros privados como saldos de tarjeta, cuentas pendientes, billeteras digitales de RMB y cuentas de gestión patrimonial estaban fácilmente accesibles de la misma forma. Esto levantó cuestionamientos gravísimos: ¿acaso el Doubao Phone estaba enviando datos personales a la nube de ByteDance para entrenar su IA? ¿Cuáles eran los límites entre los datos en el dispositivo y los datos en la nube? ¿Y qué pasaba con la información de terceros que simplemente estaba en conversaciones compartidas o archivos?
El caso rápidamente dejó de ser solo una curiosidad tecnológica y se transformó en un debate nacional sobre seguridad de datos y privacidad en la era de la inteligencia artificial agéntica, con implicaciones que reverberan mucho más allá de las fronteras chinas.
Entendiendo la IA agéntica y por qué es diferente de todo lo que vino antes
Para entender la gravedad de lo que ocurrió con el Doubao Phone, es necesario comprender cómo funciona en la práctica un agente de IA de este tipo — y por qué es fundamentalmente diferente de cualquier asistente virtual que hayas usado. Los sistemas de IA agéntica completan tareas con poca supervisión humana. Operan de forma proactiva, en diferentes entornos, y toman muchas decisiones de forma autónoma antes de necesitar cualquier intervención. Según el profesor Chen Tianhao, de la Universidad Tsinghua, los agentes de IA modifican directamente el entorno del mundo real en vez de ser herramientas pasivas. Como describió Caiwei Chen en el MIT Technology Review, es como tener un becario altamente inteligente y eficiente que completa flujos de trabajo que tradicionalmente exigían trabajo y razonamiento humano. En China, un agente de IA a veces se llama daili (代理, proxy) o zìzhǔ zhìnéngtǐ (自主智能体, actor autónomo).
A diferencia de los asistentes virtuales tradicionales como Siri o Google Assistant, que básicamente responden preguntas y ejecutan comandos simples y aislados, un agente de IA agéntica opera con autonomía real. Observa todo lo que sucede en la pantalla, lee textos, interpreta imágenes, navega por menús y toma decisiones encadenadas para completar tareas complejas. La IA agéntica típicamente funciona como una capa por encima de los modelos de lenguaje tradicionales (LLMs) como ChatGPT o DeepSeek. Mientras un chatbot responde a prompts individuales, los agentes de IA son ejecutores. Reciben un comando, lo dividen en tareas menores y completan flujos de trabajo enteros.
En la práctica, pedirle a un agente de IA que planifique un fin de semana de buen teatro y comida barata en Pekín no resultaría en un itinerario o una lista de opciones con pros y contras, como haría un chatbot. En cambio, el agente actuaría como un asistente ejecutivo de verdad: reservaría mesas en los mejores restaurantes, compraría entradas de teatro y entregaría recibos, boletos, compromisos en el calendario y mapas de desplazamiento. En China, eso significaría comprar entradas por Maoyan o Damai, hacer reservas de cena por Meituan o Dianping, y procesar todo mediante sistemas de pago automatizados de Alipay. En Estados Unidos, un proceso similar involucraría plataformas como Ticketmaster, OpenTable, Apple Pay o Google Wallet.
Para funcionar correctamente, este tipo de agente necesita permisos extremadamente amplios — acceso a la pantalla, a los datos de las aplicaciones, a las credenciales de inicio de sesión y hasta a las interfaces de pago. Ese nivel de acceso es justamente lo que permite la magia, pero también es lo que crea una vulnerabilidad sin precedentes en el ecosistema móvil.
Por qué la seguridad de datos se convirtió en el talón de Aquiles de la IA agéntica
El problema central que las grandes plataformas chinas identificaron está en la capa de autenticación y confianza. Cuando Alipay procesa una transacción financiera, parte del principio de que existe un ser humano del otro lado de la pantalla validando esa acción — ya sea por biometría facial, huella digital o contraseña. Con el agente de IA del Doubao Phone operando de forma autónoma, esa premisa se desmorona por completo.
El Doubao Phone utiliza un permiso a nivel de sistema llamado INJECT_EVENTS, que lee e interpreta la pantalla y hace clic en botones de formas indistinguibles de un usuario humano. Esto solo es posible gracias a la alianza de ByteDance con el fabricante ZTE — el agente viene fusionado directamente en el sistema operativo, no es una app común que descargas de la tienda. Para comparar, el Samsung Galaxy S26, al que los medios chinos llamaron la versión internacional del Doubao Phone, usa un enfoque híbrido: depende principalmente de acceso vía API concedido por las 200 mayores apps de la tienda de aplicaciones, con un framework de respaldo que simula interacción humana. La diferencia es enorme en términos de profundidad de acceso.
Como explicó el investigador Boyuan Wang, el agente del Doubao Phone no pide cooperación a las apps. Simplemente navega por sus interfaces como si fuera quien está sosteniendo el dispositivo. La inteligencia artificial puede simular toques en la pantalla, rellenar campos de contraseña y confirmar transacciones sin ninguna intervención humana en el momento de la ejecución. Para una institución financiera, eso equivale a tener un tercero no autorizado operando la cuenta del cliente, aunque ese tercero sea un software que el propio cliente activó voluntariamente.
No existe hoy un estándar de mercado que defina cómo las plataformas deben autenticar acciones realizadas por agentes de IA en nombre de usuarios humanos, y ese vacío regulatorio es lo que transformó el lanzamiento del Doubao Phone en un campo minado.
Sobre qué pasa con los datos después del uso, un especialista de la industria explicó al Southern Metropolis Daily que la información se envía a la nube y es procesada por el modelo para inferencia, pero no queda almacenada. Los datos de nuevas tareas sobrescriben el contenido anterior. El usuario necesita activar manualmente la función de memoria global del teléfono — que viene desactivada por defecto — para que el agente Doubao recuerde preferencias personales, como que le gusta el café helado sin azúcar. Cuando se asigna una tarea que requiere planificación y razonamiento, las capturas de pantalla de cada etapa se cargan a la nube para procesamiento, pero no se almacenan en el servidor ni se usan para entrenar el modelo. Aun así, la falta de auditorías independientes hizo que la desconfianza solo aumentara.
Fragmentación: el problema que solo China tiene (pero que afecta a todo el mundo)
Además de las cuestiones de seguridad, el caso del Doubao Phone dejó al descubierto un desafío estructural que hace la vida de la IA agéntica especialmente difícil en China: la fragmentación del ecosistema móvil. Y este problema se manifiesta de dos formas distintas.
Fragmentación de las superapps
La primera es la fragmentación de las superapps. China tiene apps que hacen de todo — llamadas superapps. WeChat y Alipay combinan las funciones de Facebook, WhatsApp, Amazon, Uber, Google Maps, tienda de aplicaciones y app bancaria en una única interfaz. Meituan, Douyin y Taobao también están expandiendo sus ofertas. Cada superapp funciona casi como un sistema operativo propio, con desarrolladores creando exclusivamente para ese ecosistema. Y como Apple y Windows, WeChat y Alipay son jardines amurallados. Diseñados para retener el tráfico y las interacciones de los usuarios, tienden a no compartir datos ni ofrecer servicios que se conecten externamente.
Lo que esto significa para los agentes de IA es que cuando intentan acceder al contenido de un mensaje en WeChat discutiendo planes de cena, la tarea simplemente falla sin que el agente tenga capacidad de leer y actuar sobre la información dentro del jardín amurallado de la app. Es exactamente por eso que el bloqueo de WeChat al Doubao Phone fue un acontecimiento tan significativo.
Fragmentación de dispositivos
La segunda forma de fragmentación es la de dispositivos. En todo el mundo, los celulares Android poseen una capa de apps y servicios llamada Google Mobile Services (GMS) sobre el sistema operativo Android. Es por eso que celulares Samsung, Google o Motorola comparten Gmail, Chrome, Google Maps y la Google Play Store. Pero China bloquea Google. Entonces los fabricantes chinos de smartphones Android desarrollaron equivalentes al GMS que corren sobre el sistema operativo open source de Android. Los usuarios chinos que cambian de un celular Android de una marca a otra necesitan también cambiar tiendas de apps, servicios de nube, asistentes virtuales, notificaciones push y varios otros servicios. Para complicar aún más las cosas, Huawei fabrica y vende sus celulares con un sistema operativo propio, HarmonyOS, con sus propios servicios.
Ambos tipos de fragmentación son enemigos de la interoperabilidad y, en consecuencia, de la IA agéntica. La IA agéntica china solo avanzará si supera estas barreras — que es exactamente lo que el Doubao Phone intenta hacer. No es sorpresa, por lo tanto, que su lanzamiento haya causado una tormenta. Y a largo plazo, cualquier empresa que consiga superar estas barreras en China podrá entregar una IA más útil y poderosa.
La carrera regulatoria y la batalla por estándares
El panorama regulatorio en China está en ebullición. Existe una disputa en múltiples frentes para definir quién va a dictar las reglas de la IA agéntica. De un lado, las plataformas de internet que controlan las superapps. Del otro, las empresas con agentes de IA, fabricantes de dispositivos y empresas estatales de telecomunicaciones que también actúan como proveedores de nube. Los ganadores van a moldear las reglas para acceso a datos, autenticación de seguridad y mucho más.
La situación evoluciona rápidamente, a veces en direcciones opuestas. Semanas antes de la polémica del Doubao Phone, usuarios de WeChat reportaron que Tencent podría haber bloqueado al agente de IA de Huawei, llamado Xiaoyi o Celia, para iniciar llamadas. Al mismo tiempo, algunas superapps están dando pasos para ofrecer mayor acceso a los agentes. Alipay lanzó un superportal llamado Zhixiabao que permite que agentes de IA accedan a funciones como delivery de comida y servicios financieros dentro de sus mini-programas, promoviéndolo para usuarios Android e iOS como un Gestor de Vida IA.
Existe también una disputa separada entre empresas estatales de telecomunicaciones — como China Mobile y China Telecom — y plataformas privadas de internet y nube como Alibaba Cloud y Tencent Cloud. En China, las empresas de telecomunicaciones funcionan como proveedoras de nube estatales — imagina Amazon Web Services con sus propias torres de celular. Los tipos de datos que cada jugador posee son diferentes: las telecoms tienen datos de ubicación, patrones de llamada y comportamiento de red, mientras que las plataformas recopilan información sobre preferencias del usuario, datos demográficos sociales y transacciones financieras.
En cuanto a estándares técnicos, China y Estados Unidos están desarrollando protocolos para permitir que agentes de IA trabajen a través de sistemas digitales. Muchos desarrolladores en ambos países utilizan el Model Context Protocol (MCP), introducido por Anthropic en noviembre de 2024. Esta especie de infraestructura invisible permite interoperabilidad, como explican Matt Steinberg y Prem M. Trivedi, funcionando como un puerto USB-C que opera como un enchufe universal. En China, Gaode Map y Feishu ya integraron el MCP. Pero Meituan, por ejemplo, no se abrió a apps de terceros y no soporta el protocolo — lo que dificulta escenarios como la reserva de viaje automatizada.
Privacidad, consentimiento y la paradoja que la IA agéntica amplifica
Estudiosos chinos de derecho digital están cuestionando si los avances de la IA agéntica no exigen una reevaluación fundamental de los conceptos basilares del marco de protección de datos de China — que fue modelado a partir del GDPR de la Unión Europea, a veces llamado GDPR con características chinas. Conceptos como consentimiento, limitación de finalidad y minimización de datos pueden ser subvertidos por agentes de IA que alteran la relación de los usuarios con su información personal.
Como alertó Chen Tianhao de la Universidad Tsinghua, el agente de IA integrado en el sistema operativo amplificó la paradoja de la privacidad en la era de la IA, donde usuarios que buscan conveniencia inconscientemente consolidan información originalmente dispersa en varias apps en manos de un único agente inteligente a nivel de sistema. Wang Yuan, un estudioso de derecho de datos, va más allá y argumenta que la generación de datos desdibujó los límites entre recolección y procesamiento de datos, volviendo muchas leyes de protección de privacidad ineficaces.
Wang recomienda crear un tipo dinámico y participativo de consentimiento para reflejar la naturaleza constantemente cambiante de los datos usados por agentes de IA, pero reconoce que una avalancha de ventanas emergentes interfiere en la experiencia del usuario y se vuelve ineficaz. Las alternativas incluyen permitir que los usuarios personalicen configuraciones de consentimiento dinámico, privacidad por diseño, eliminación automática de datos tras períodos determinados y anonimización más robusta.
El hack de la accesibilidad
Otro ángulo preocupante revelado por investigadores chinos involucra los servicios de accesibilidad de los smartphones. Para que los agentes de IA funcionen en celulares, las apps necesitan permitir su entrada. Como muchos desarrolladores dudan en conceder ese acceso — temiendo pérdida de datos, tráfico e ingresos publicitarios —, los agentes de IA pueden explotar servicios de accesibilidad, originalmente diseñados para ayudar a personas con discapacidad a usar el celular sin las manos.
Un estudio del Instituto de Investigación de Tecnología de Conformidad Nanfang reveló que agentes de IA en smartphones habilitaban permisos de accesibilidad para acceder a todo el contenido privado de la pantalla y realizar operaciones sin notificar a los usuarios. Los asistentes podían ver contraseñas de tarjetas bancarias y registros de conversaciones, además de hacer clic, presionar prolongadamente y deslizar la pantalla. Los investigadores evaluaron seis smartphones ejecutando agentes de IA y descubrieron que la situación era bastante caótica — algunos aparatos desactivaban la accesibilidad tras completar la tarea, otros la dejaban activa indefinidamente.
Zhu Yue, de la Facultad de Derecho de la Universidad Tongji, observa que los LLMs ya se beneficiaron del acceso a grandes volúmenes de videos, imágenes y anotaciones de texto proporcionados por servicios de accesibilidad. Escribió que estas cuestiones son un área descuidada del derecho de IA: simplemente al rastrear contenido multimedia y sus descripciones correspondientes, la IA disfruta de un almuerzo gratis 🍽️.
Qué significa el caso Doubao Phone para el futuro de la IA
El episodio que involucra al Doubao Phone no es solo una pelea entre gigantes de la tecnología china disputando el control de datos y acceso a usuarios. Funciona como un laboratorio vivo de las tensiones que van a definir cómo la inteligencia artificial se integra en la vida cotidiana de las personas en los próximos años. Y la relevancia va mucho más allá de China: poco antes de la polémica del Doubao Phone, el mundo occidental tuvo su propia versión del debate con la aparición de OpenClaw, un poderoso agente de IA de código abierto, y de Moltbook, una red social creada exclusivamente para agentes de IA. Especialistas en seguridad de Estados Unidos llamaron a la combinación de riesgos tríada letal.
Meredith Whittaker, presidenta de Signal, alertó durante la conferencia SXSW que la IA agéntica amenaza con romper la barrera hematoencefálica entre la capa de aplicación y la capa del sistema operativo al unir todos esos servicios separados y mezclar sus datos. Nate Jones, estratega de IA, complementó: pasamos 20 años construyendo límites de seguridad alrededor de nuestros sistemas operativos, pero los agentes exigen destruir eso por la propia naturaleza de lo que un agente es — necesita leer tus archivos, acceder a tus credenciales. La propuesta de valor exige abrir agujeros en cada límite que los equipos de seguridad pasaron décadas construyendo.
Esta discusión sobre interoperabilidad y gobernanza de IA agéntica probablemente va a dominar la agenda regulatoria de tecnología en 2026, no solo en China, sino en mercados como la Unión Europea, Estados Unidos y Brasil, que ya poseen marcos legales de protección de datos en vigor o en desarrollo.
Caminos posibles y recomendaciones que ya circulan
Tras la polémica, recomendaciones para nuevas reglas ya están circulando mientras los reguladores chinos evalúan tanto la disputa comercial entre plataformas como las preocupaciones planteadas por ciudadanos comunes. Chen, de Tsinghua, recomienda crear estándares — posiblemente regulaciones obligatorias además de directrices de la industria — donde el Doubao detectaría acciones de mayor riesgo y automáticamente suspendería el control de la IA para devolver la decisión al usuario. Una alianza de la industria de tecnología financiera de China ya publicó recomendaciones preliminares para aplicaciones financieras de IA agéntica, incluyendo directrices sobre procesamiento de datos y estudios de caso sobre cómo las instituciones financieras están construyendo e integrando agentes de IA.
Otra recomendación es exigir procesamiento local en el dispositivo para información particularmente sensible, como contenido de registros de conversaciones y álbumes de fotos, en vez de enviarla a la nube. Escenarios específicos podrían clasificarse por nivel de riesgo, de forma similar a cómo las regulaciones chinas de transferencia transfronteriza de datos ya asignan diferentes niveles de riesgo a diferentes tipos de datos.
Otros están proponiendo ver la IA agéntica a través de una lente antimonopolio. La Ley Antimonopolio de China prohíbe ciertos tipos de adquisición de datos, el llamado secuestro de tráfico. Los agentes de IA podrían ser regulados como gatekeepers digitales — por ejemplo, impidiendo que Doubao AI dirija a los usuarios hacia Douyin e-commerce, también propiedad de ByteDance.
ByteDance ya está explorando alianzas con Lenovo, Vivo y otros fabricantes de dispositivos, y podría apuntar a mercados internacionales para sus celulares con IA. Especialistas de la industria creen que cuando la tecnología sea mejor comprendida, China va a publicar nuevos estándares y reglas. Las implicaciones serán de largo alcance.
La verdad es que la tecnología llegó antes que la regulación, y ahora el mercado corre para llenar ese vacío. El caso deja una lección clara para toda la industria: innovación sin gobernanza robusta de datos no es progreso, es riesgo mal calculado 🚨. El próximo capítulo de la historia de la IA no es solo sobre chips o una única aplicación. Es sobre acceso a datos, control de tráfico y permisos para que los agentes trabajen de forma integrada a través de paisajes fragmentados de dispositivos y servicios. El smartphone del futuro puede ser capaz de hacer todo por ti — pero antes de eso, alguien necesita garantizar que no va a hacer todo a pesar de ti.
