Miles de personas están vendiendo sus identidades para entrenar IA, pero ¿a qué costo?
La identidad humana siempre tuvo valor, pero nunca fue tan literalmente negociable como ahora. Con la explosión de la inteligencia artificial, un nuevo tipo de mercado surgió casi en silencio: plataformas que pagan a personas comunes por compartir sus voces, rostros, conversaciones e incluso los sonidos a su alrededor, todo para alimentar los modelos que están rediseñando el mundo digital.
No estamos hablando de ciencia ficción ni de algo restringido a Silicon Valley. Esta realidad ya forma parte del día a día de miles de personas repartidas por todos los continentes, desde jóvenes universitarios en India hasta aprendices de soldador en Estados Unidos. Y lo más impresionante es que este mercado creció tan rápido que la mayoría de las personas involucradas todavía no entiende completamente lo que está en juego.
Historias reales de quienes alimentan la máquina
Jacobus Louw, de 27 años, vive en Ciudad del Cabo, Sudáfrica, y filmó sus caminatas matutinas alimentando gaviotas para una tarea llamada Urban Navigation en la aplicación Kled AI. Un solo video de sus pies y de la vista mientras caminaba por la acera le generó 14 dólares, cerca de diez veces el salario mínimo diario del país. En dos semanas, acumuló 50 dólares solo enviando fotos y videos de su rutina. Louw enfrentó dificultades con un trastorno nervioso durante años y no conseguía empleo formal, pero el dinero ganado en marketplaces de datos para IA le permitió ahorrar para un curso de masoterapia de 500 dólares.
A miles de kilómetros de allí, en Ranchi, India, Sahil Tigga, un estudiante de 22 años, gana dinero regularmente al permitir que la aplicación Silencio acceda al micrófono de su celular para capturar ruidos urbanos, como el bullicio dentro de un restaurante o el tráfico en un cruce concurrido. También graba su propia voz y viaja para capturar escenarios únicos, como lobbies de hoteles que aún no fueron documentados en el mapa de la aplicación. Con eso, recibe más de 100 dólares al mes, suficiente para cubrir todos sus gastos de alimentación.
Y en Chicago, Ramelio Hill, un aprendiz de soldador de 18 años, ganó unos cuantos cientos de dólares vendiendo sus llamadas telefónicas privadas con amigos y familiares a Neon Mobile, una plataforma de entrenamiento de IA conversacional que pagaba 0,50 dólares por minuto. Para Hill, la lógica era simple: imaginaba que las empresas de tecnología ya capturaban buena parte de sus datos personales, así que ¿por qué no recibir al menos una tajada de esa ganancia? 🤔
Estos tres perfiles no son excepciones. Son el retrato de una economía gig que está creciendo rápido, impulsada por la sed de las big techs por datos humanos de calidad y por la necesidad real de miles de personas alrededor del mundo de encontrar nuevas formas de ingreso. Pero esta ecuación tiene un lado que rara vez aparece en los términos de uso de estas plataformas, y es exactamente ese lado el que vale la pena entender antes de presionar cualquier botón de aceptar. 👀
Por qué las empresas de IA están desesperadas por datos humanos
Detrás de cada modelo de lenguaje como ChatGPT o Gemini, cada sistema de reconocimiento facial o asistente de voz, existe una necesidad que no tiene fin: datos de entrenamiento. Y no cualquier dato, sino datos humanos reales, ricos en contexto, diversidad y naturalidad. Es eso lo que diferencia a un modelo mediocre de uno que realmente parece entender lo que le estás diciendo.
El problema es que las fuentes más utilizadas de entrenamiento, como los datasets C4, RefinedWeb y Dolma, que representan cerca de un cuarto de los conjuntos de datos de mayor calidad disponibles en la web, están cada vez más restringiendo el acceso a empresas de IA generativa. Investigadores estiman que las compañías de inteligencia artificial podrían quedarse sin texto nuevo de alta calidad para entrenar sus modelos ya en 2026. Algunos laboratorios intentaron sortear este problema alimentando los modelos con datos sintéticos generados por la propia IA, pero este proceso recursivo puede llevar a los sistemas a producir contenido lleno de errores y distorsiones, comprometiendo gravemente su calidad.
Es exactamente en ese vacío donde entran plataformas como Kled AI, Silencio y Neon Mobile. En estos marketplaces de datos, millones de personas están monetizando sus identidades para alimentar y entrenar modelos de IA. Además de estas tres, existen diversas otras opciones: Luel AI, respaldada por la famosa incubadora Y-Combinator, compra conversaciones multilingües por cerca de 0,15 dólares por minuto. ElevenLabs permite clonar digitalmente tu voz y autorizar a cualquier persona a usarla por una tarifa base de 0,02 dólares por minuto.
Bouke Klein Teeselink, profesor de economía en el King’s College London, afirmó que el entrenamiento gig de IA es una nueva categoría de trabajo emergente que va a crecer sustancialmente. Según él, las empresas de IA saben que pagar a las personas para licenciar sus datos ayuda a evitar disputas de derechos de autor que enfrentarían si dependieran exclusivamente de contenido extraído de la web. Veniamin Veselovsky, investigador de IA, complementó diciendo que estas empresas también necesitan datos de alta calidad para modelar nuevos comportamientos en sus sistemas. Para él, los datos humanos son, por ahora, el estándar de oro para muestreo fuera de la distribución del modelo. 💡
La economía gig tiene un nuevo rostro
La economía gig no es ninguna novedad. Conductores de aplicaciones, repartidores y freelancers ya conocen bien el modelo de trabajo por demanda, sin vínculo formal y con remuneración variable. Pero lo que está ocurriendo ahora con el mercado de datos para inteligencia artificial representa una evolución significativa de ese modelo, porque el producto entregado ya no es un servicio físico o una habilidad profesional específica. Es la propia identidad de la persona: su voz, su imagen, sus patrones de comportamiento, sus formas de expresarse. Esto cambia completamente la naturaleza de la relación entre trabajador y plataforma, y pone en juego cuestiones que la legislación laboral tradicional todavía no sabe responder bien.
Los humanos que alimentan estas máquinas, especialmente aquellos en países en desarrollo, frecuentemente necesitan el dinero y tienen pocas otras opciones para obtenerlo. Para muchos entrenadores gig de IA, hacer este trabajo es una respuesta pragmática a la disparidad económica. En países con alto desempleo y monedas devaluadas, ganar en dólares estadounidenses es muchas veces más estable y gratificante que los empleos locales. Como el propio Louw resumió: como sudafricano, que te paguen en dólares vale más de lo que la gente imagina.
Incluso en naciones más ricas, el costo de vida creciente transformó la venta de datos personales en una decisión financiera lógica para mucha gente. Algunos de estos trabajadores luchan por conseguir empleos de nivel básico y recurren al entrenamiento de IA por necesidad. El modelo funciona de manera relativamente directa: las plataformas publican tareas con instrucciones específicas, como grabar tu voz leyendo determinadas frases, filmar tus manos ejecutando movimientos comunes, o capturar sonidos ambientales en lugares específicos. El trabajador completa la tarea, envía los datos y recibe el pago, generalmente vía PayPal o créditos que pueden canjearse por dinero.
Parece simple, y para muchas personas funciona bien como complemento de ingresos. El problema empieza a aparecer cuando se leen con atención los términos de uso de estas plataformas. 😬
Permisos de carta blanca y los riesgos invisibles
Existe una diferencia importante entre compartir datos pasivamente, como sucede cuando usas redes sociales o aplicaciones de navegación, y vender datos activamente como forma de trabajo. En el segundo caso, la persona está tomando una decisión consciente, pero no siempre con toda la información necesaria para evaluar las consecuencias a largo plazo.
En la mayoría de los casos, la cesión de derechos sobre los datos es total, irrevocable y permanente. Cuando los entrenadores de IA comparten sus datos en plataformas como Neon Mobile y Kled AI, están otorgando una licencia de carta blanca, mundial, exclusiva, irrevocable, transferible y libre de regalías, para vender, usar, exhibir públicamente y almacenar su imagen, e incluso crear obras derivadas a partir de ella. Esto significa que una grabación de voz de 20 minutos hecha hoy puede alimentar un bot de atención al cliente durante los próximos años, sin que el entrenador reciba ni un centavo más.
Avi Patel, fundador de Kled AI, afirmó que los acuerdos de datos de su empresa limitan el uso a fines de entrenamiento de IA e investigación. Según él, todo el negocio depende de la confianza de los usuarios, y la empresa evalúa a los compradores antes de vender conjuntos de datos, evitando trabajar con empresas de intenciones cuestionables, como pornografía, u organismos gubernamentales que puedan usar los datos de formas que entren en conflicto con esa confianza.
Por su parte, Neon Mobile no respondió a las solicitudes de comentarios. Y quizás eso diga bastante sobre cómo estas plataformas enfrentan la transparencia.
Jennifer King, investigadora de privacidad de datos en el Stanford Institute for Human-Centered Artificial Intelligence, destaca que lo más preocupante es la falta de claridad sobre cómo y dónde se utilizarán los datos de los usuarios. Sin negociar ni conocer sus derechos, los consumidores corren el riesgo de que sus datos sean reutilizados de formas que no les gustan, que no entendieron o que no previeron, y tendrán poca posibilidad de recurso legal.
Enrico Bonadio, profesor de derecho en City St George’s, Universidad de Londres, va más allá: según él, los términos de estos acuerdos permiten que las plataformas y sus clientes hagan prácticamente cualquier cosa con ese material, para siempre, sin ningún pago adicional y sin ninguna forma realista de que el contribuyente retire su consentimiento o renegocie. Los riesgos más graves incluyen el uso de los datos para deepfakes y suplantación de identidad. Aunque los marketplaces de datos afirmen eliminar identificaciones como nombre y ubicación antes de vender los datos, los patrones biométricos son, por naturaleza, difíciles de anonimizar de forma robusta.
Cuando lo barato sale caro: historias de arrepentimiento
El caso de Ramelio Hill ilustra bien cómo las cosas pueden salir mal. Por cerca de 11 horas de llamadas telefónicas, ganó 200 dólares de Neon Mobile. Pero la aplicación frecuentemente se caía y retrasaba los pagos. En septiembre, apenas semanas después del lanzamiento, la plataforma dejó de funcionar después de que el sitio TechCrunch descubriera una falla de seguridad que permitía a cualquier persona acceder a números de teléfono, grabaciones de llamadas y transcripciones de los usuarios. Hill dijo que Neon Mobile nunca le informó sobre esto, y ahora le preocupa la forma en que su voz pueda ser mal utilizada en internet.
Todavía más emblemático es el caso de Adam Coy, un actor de Nueva York que vendió su imagen en 2024 por 1.000 dólares a Captions, un editor de video impulsado por IA actualmente llamado Mirage. Su contrato incluía protecciones más detalladas: su identidad no podría usarse con fines políticos, ni para vender alcohol, tabaco o pornografía, y la licencia expiraría en un año.
Incluso con estas salvaguardas, no pasó mucho tiempo antes de que amigos comenzaran a reenviarle videos encontrados en internet con el rostro y la voz de Adam acumulando millones de visualizaciones. En uno de esos videos, un reel en Instagram, la réplica de IA de Adam se presentaba como médico ginecólogo y promocionaba suplementos médicos no comprobados para mujeres embarazadas y en posparto.
Fue vergonzoso tener que explicarle eso a la gente, dijo Coy. Admitió que la decisión de vender su imagen partió de una lógica parecida a la de Hill: si la mayoría de los modelos iban a rastrear internet en busca de datos e imágenes de cualquier forma, al menos que él recibiera algo a cambio. Desde entonces, sin embargo, Coy no se inscribió en ninguna otra tarea de datos para IA. Solo consideraría hacerlo de nuevo si una empresa ofreciera una compensación realmente significativa.
El futuro de los trabajadores de datos para IA
Mark Graham, profesor de geografía de internet en la Universidad de Oxford y autor del libro Feeding the Machine, reconoció que para personas en países en desarrollo el dinero puede ser significativo a corto plazo. Pero advirtió que, estructuralmente, este trabajo es precario, no progresivo y efectivamente un callejón sin salida.
Según Graham, los marketplaces de IA dependen de una carrera hacia el fondo en los salarios y de una demanda temporal por datos humanos. Cuando esa demanda cambie, y va a cambiar, los trabajadores se quedarán sin protecciones, sin habilidades transferibles y sin red de seguridad. El único ganador que emerge, según él, son las plataformas del norte global que capturan todo el valor duradero.
La discusión sobre la regulación de este mercado está avanzando en algunas regiones, pero todavía de forma bastante fragmentada. La Unión Europea ha sido la más activa en este campo, con el AI Act estableciendo algunas directrices sobre cómo los datos personales pueden usarse en el entrenamiento de modelos de inteligencia artificial. En Estados Unidos, el debate es más descentralizado, con algunos estados avanzando en legislaciones específicas mientras el gobierno federal aún busca consenso. En Latinoamérica, las leyes de protección de datos personales ofrecen una base legal importante, pero la aplicación práctica en el contexto del mercado de datos para IA todavía es un territorio en construcción, con muchas zonas grises que las plataformas saben explotar muy bien.
El resultado es que, en la práctica, quien vende sus datos hoy rara vez tiene garantías claras sobre cómo serán utilizados, por cuánto tiempo o con quién serán compartidos.
Por qué esta conversación importa ahora
Lo que hace esta discusión aún más relevante es que no está ocurriendo en algún futuro distante. Está ocurriendo ahora, con personas reales tomando decisiones reales sobre su identidad y sus datos todos los días. El mercado de datos para inteligencia artificial ya mueve miles de millones de dólares globalmente, y la demanda solo tiende a crecer a medida que los modelos se vuelven más sofisticados y necesitan volúmenes mayores y más diversificados de datos humanos para seguir evolucionando.
La nueva economía gig de entrenamiento de IA presenta un pacto fáustico bastante claro: a cambio de unos cuantos dólares, sus entrenadores están alimentando una industria que eventualmente podría volver obsoletas sus propias habilidades, al mismo tiempo que quedan vulnerables a un futuro de deepfakes, robo de identidad y explotación digital que apenas están empezando a comprender.
Entender cómo funciona este mercado, quién se beneficia de él y cuáles son los riesgos involucrados no es una cuestión técnica reservada a especialistas. Es una cuestión que concierne a cualquier persona que tenga una voz, un rostro y una historia, es decir, todo el mundo. 🌐
