AI Agents: Why They Still Need Human Supervision

El jefe de gabinete de un multimillonario: cómo un pionero de la IA pone a trabajar una docena de agentes

Agentes de IA ya forman parte de la rutina laboral de algunas de las mentes más brillantes del sector tecnológico. Y cuando hablamos de uno de los creadores de la arquitectura que dio origen a ChatGPT usando una docena de ellos en su día a día, vale la pena detenerse y prestar atención a lo que tiene que decir.

Illia Polosukhin no es cualquier nombre en el mundo de la inteligencia artificial. Es coautor del paper Attention Is All You Need, publicado en 2017, que presentó al mundo la arquitectura Transformer, la base técnica detrás de los grandes modelos de lenguaje que conocemos hoy. En otras palabras, la T de ChatGPT existe gracias a su trabajo.

Pero aquí viene el detalle más interesante de todo esto: aun siendo uno de los mayores especialistas del planeta en el tema, Polosukhin no deja que sus agentes trabajen a sus anchas. Y el motivo es más sencillo de lo que parece. 👇

Una docena de agentes y una descripción bien directa en el prompt

En su día a día, Polosukhin trabaja con 12 agentes completando diferentes misiones para él. Una de esas misiones, por ejemplo, es ayudarle a convertirse en un mejor CEO. En la práctica, el agente resume todas las notas de reuniones, documentos de Google Drive y mensajes de Slack, y después entrega un resumen ejecutivo con coaching sobre lo que ocurrió, lo que podría estar pasando por alto y dónde hay decisiones atascadas. Este flujo se ejecuta cada semana de forma automatizada.

Y la descripción que usa para estos agentes es bastante reveladora. Polosukhin los llama su soporte a nivel de jefe de gabinete de un multimillonario. Según él, esa frase está literalmente en el prompt: eres el jefe de gabinete de un multimillonario. Es una instrucción clara y directa que define el nivel de responsabilidad y contexto que el agente necesita tener al ejecutar sus tareas.

Este enfoque ofrece un vistazo al futuro que Polosukhin visualiza no solo para trabajadores individuales o CEOs, sino para toda la economía global. Un mundo donde agentes pueden realizar negociaciones, coordinar cadenas de suministro e intermediar transacciones en nombre de personas y grandes empresas. Y, en su visión, nosotros estamos completamente desprevenidos para eso.

Lo que Polosukhin hace diferente en el uso de agentes

En vez de configurar sus agentes de IA para funcionar de forma totalmente autónoma, Polosukhin mantiene lo que él mismo describe como puntos de verificación a lo largo de los flujos de trabajo. En momentos estratégicos, el agente se detiene, presenta lo que hizo hasta ese punto y espera una confirmación humana antes de continuar. Esto no es una limitación tecnológica, es una elección deliberada y bien fundamentada. Para quien usa agentes en el trabajo, este enfoque cambia completamente la dinámica de confianza entre humano y máquina, porque sabes exactamente lo que se está haciendo y en qué etapa se encuentra el proceso.

Este comportamiento no viene de una desconfianza ciega en la tecnología. Polosukhin entiende mejor que casi cualquier persona cómo funcionan estos sistemas por dentro, justamente porque ayudó a construir su base. El punto aquí es que la supervisión humana no es una señal de que la IA falló. Es una capa de seguridad que garantiza que el resultado final realmente corresponda a lo que querías desde el principio. Cuando un agente toma decisiones en cadena sin ninguna pausa para revisión, pequeños errores de interpretación al inicio pueden convertirse en grandes problemas al final.

Como él mismo resumió en una entrevista con Business Insider: si simplemente lo dejo correr y hacer las cosas, vuelvo y encuentro algo que no tiene ningún sentido. Entonces necesitas estar pendiente con tu propio criterio.

Reciba el mejor contenido sobre innovación en su correo electrónico.

Todas las noticias, consejos, tendencias y recursos que buscas, directamente en tu bandeja de entrada.

Al suscribirte al boletín informativo, aceptas recibir comunicaciones de Método Viral. Nos comprometemos a proteger y respetar siempre tu privacidad.

Además, existe un aspecto práctico muy relevante en esta discusión. Los agentes que operan de forma autónoma en tareas complejas suelen interactuar con sistemas externos, APIs, bases de datos y herramientas diversas. Cada una de esas interacciones representa un punto donde algo puede salirse del camino, ya sea por una instrucción mal interpretada, una respuesta inesperada de un servicio externo o simplemente una decisión que tenía sentido para el modelo pero no tenía sentido para el contexto real del negocio. Tener un humano en el loop, especialmente en esos puntos críticos, reduce significativamente ese riesgo.

La sociedad no está preparada para la AGI, según Polosukhin

Más allá de los desafíos operativos de usar agentes en el día a día, Polosukhin plantea una preocupación mucho más amplia. Según él, el mayor problema es que fundamentalmente no hemos preparado el sistema para que la inteligencia artificial general (AGI) esté disponible. Y cuando habla de sistema, se refiere a la sociedad, a internet y a las instituciones gubernamentales.

Esta es una declaración fuerte, especialmente viniendo de alguien que no es un comentarista externo, sino uno de los arquitectos de la tecnología que está en el centro de esta revolución. Polosukhin cuenta que lleva años advirtiendo que los modelos van a empezar a romper todo. Describe la situación como un juego del gato y el ratón, donde cada nueva iteración de modelo logra romper aquello que la iteración anterior había corregido.

Un ejemplo concreto que refuerza esta visión vino de Anthropic, que anunció que su modelo más reciente en vista previa, Mythos, es tan capaz de encontrar y explotar vulnerabilidades que el laboratorio decidió limitar el acceso a él. Para Polosukhin, esto no es ninguna sorpresa. Es exactamente el tipo de escenario que viene describiendo hace años.

El problema de la confianza ciega en una única empresa

En un mundo donde personas gestionan su salud y corporaciones gestionan logística usando agentes de IA, Polosukhin identifica una necesidad urgente de una capa de confianza y seguridad en el backend. Y es exactamente en eso en lo que está trabajando en NEAR.

Su proyecto con NEAR está construyendo infraestructura para reducir la dependencia de los agentes de IA en una única empresa, como un laboratorio de IA frontier, para controlar y supervisar cada etapa de una tarea. En la práctica, esto significa que un agente de IA que maneja tu información de inicio de sesión, reserva tus viajes y mueve dinero para pagar un boleto de avión no requeriría que el usuario confiara ciegamente en un único portero.

La preocupación de Polosukhin aquí está bien fundamentada. Como él explicó: esto va a tener toda tu información. Literalmente, tu vida va a estar ahí. Entonces no quieres que ninguna empresa individual tenga control o acceso a todo eso.

Y no estamos hablando solo de filtración de datos. Otro riesgo que Polosukhin quiere combatir es el de manipulación. Cada vez más personas usan IA para obtener información, desde resúmenes de noticias hasta sugerencias de inversión. Un laboratorio de IA, o un agente malintencionado dentro de él, podría moldear discretamente esas respuestas sin que el usuario lo percibiera.

Un caso real que ilustra este peligro ocurrió con Grok, de xAI, cuando el chatbot empezó a mencionar repetidamente un tema extremadamente sensible en respuestas que no tenían ninguna relación con el asunto. La empresa atribuyó el problema a una modificación no autorizada en el backend del sistema. Este tipo de incidente muestra cómo la falta de transparencia puede tener consecuencias graves.

La propuesta de Polosukhin con NEAR es desarrollar una plataforma de código abierto y auditable, que dé a los usuarios mayor visibilidad sobre cómo opera un sistema de IA, en vez de tratarlo como una caja negra.

Por qué la infraestructura backend importa en esta ecuación

Cuando empiezas a poner agentes de IA a trabajar de verdad, la conversación rápidamente sale del nivel de los prompts y va directo a la infraestructura backend que sostiene todo esto. No sirve de nada tener un agente bien configurado e inteligente si la estructura detrás de él no logra registrar lo que hizo, no guarda contexto entre las sesiones o no ofrece ninguna visibilidad sobre las acciones ejecutadas.

La infraestructura backend de un sistema con agentes necesita, como mínimo, ofrecer trazabilidad. Esto significa poder responder preguntas como:

¿Qué hizo este agente en las últimas dos horas?
¿Qué herramientas usó?
¿Qué decisiones tomó de forma autónoma y cuáles escaló a un humano?

Sin estas respuestas disponibles de forma clara, la supervisión humana queda comprometida porque ni siquiera tienes la información necesaria para supervisar nada. Es como intentar revisar un documento sin poder ver el historial de ediciones.

Otro punto que merece atención es la cuestión de la latencia y la confiabilidad de los sistemas que los agentes acceden. Un agente que depende de múltiples servicios externos para completar una tarea está expuesto a fallos en cascada si cualquiera de esos servicios presenta lentitud o inestabilidad. Por eso, diseñar la infraestructura pensando en resiliencia, con fallbacks bien definidos y timeouts adecuados, es parte esencial de cualquier deployment serio de agentes de IA en entorno productivo. Esto no es un detalle técnico secundario. Es lo que separa un experimento de laboratorio de una solución que funciona de verdad.

Del vibe coding a los agentes: la visión que vino de 2017

Muy poco sobre la trayectoria de la IA sorprende a Polosukhin. En el mismo año en que el paper de la arquitectura Transformer fue publicado, fundó NEAR AI en torno a la idea de que las máquinas podrían eventualmente generar software. Su tesis era simple: los humanos conversarían con computadoras en lenguaje natural, como inglés, y las máquinas escribirían el código.

En 2017, esa idea parecía bastante absurda, como él mismo admitió. Hoy, eso tiene nombre: vibe coding. Es una de las tendencias más calientes del momento, con desarrolladores usando modelos de lenguaje para generar código a partir de descripciones en texto. O sea, lo que parecía ciencia ficción hace menos de una década se convirtió en herramienta de trabajo.

Esa capacidad de ver hacia dónde camina la tecnología años antes de que llegue es lo que hace que las opiniones de Polosukhin sean particularmente valiosas. Cuando alguien con ese historial dice que la supervisión humana sigue siendo fundamental, vale la pena tomarlo en serio.

El papel del Transformer en esta nueva generación de agentes

Entender qué hace que los agentes de IA actuales sean tan capaces pasa, obligatoriamente, por entender la arquitectura Transformer. Cuando Polosukhin y sus colegas publicaron el paper en 2017, el enfoque estaba en tareas de traducción automática. Pero el mecanismo de atención que describieron demostró ser increíblemente versátil, y en los años siguientes se convirtió en la columna vertebral de prácticamente todos los grandes modelos de lenguaje, incluyendo las familias GPT, Claude, Gemini y Llama. Es esta arquitectura la que permite que un modelo mantenga contexto a lo largo de una conversación larga, que entienda matices del lenguaje y que conecte información aparentemente distante dentro de un texto.

Herramientas que usamos a diario

Productividad y Organización

Operación

Marketing y Ventas

Inspección de Texto y Clipping

Contenido y Escritura

Búsqueda e Investigación

Automatización

Pero la arquitectura Transformer, por más poderosa que sea, tiene límites bien conocidos. El modelo trabaja con probabilidad, no con certeza. Genera la respuesta más probable dado el contexto que recibió, y esto significa que en situaciones ambiguas o fuera del patrón de su entrenamiento, puede producir respuestas plausibles que están simplemente equivocadas. Cuando colocas este tipo de modelo en el centro de un agente que toma acciones reales en el mundo, ya sea enviando correos electrónicos, ejecutando código o modificando archivos, ese margen de error deja de ser solo una inconveniencia y se convierte en un riesgo concreto.

Es exactamente ahí donde la supervisión humana cierra el ciclo de forma elegante. El Transformer es excelente para procesar información, identificar patrones, generar texto y razonar sobre problemas complejos. El humano es excelente para validar si lo que fue generado tiene sentido en el contexto real, si está alineado con los objetivos del negocio y si no va a causar ningún efecto colateral indeseado. Cuando estos dos trabajan juntos, con el agente haciendo el trabajo pesado y el humano haciendo las revisiones estratégicas, el resultado tiende a ser mucho mejor que lo que cualquiera de los dos conseguiría solo.

Qué cambia esto en la forma de pensar la automatización con IA

La narrativa popular en torno a los agentes de IA suele enfatizar la autonomía total como el objetivo final. La idea de tener un agente que se encargue de todo mientras tú haces otra cosa es seductora, y no es completamente irrealista para tareas muy bien definidas y de bajo riesgo. Pero cuando el alcance aumenta y las tareas involucran juicio, creatividad, contexto organizacional o impacto en otras personas, la autonomía sin supervisión empieza a crear más problemas de los que resuelve. Polosukhin, con todo su bagaje técnico, llegó a esta conclusión de forma práctica, no teórica.

Lo que cambia en la práctica es la forma en que diseñas tus flujos de trabajo con agentes. En vez de preguntar cómo hago para que el agente haga todo solo, la pregunta más productiva suele ser: ¿en qué momentos tiene sentido traer a un humano al loop y en cuáles el agente puede avanzar con seguridad? Esta distinción exige que entiendas bien tanto las capacidades como las limitaciones del modelo que estás usando, y también que conozcas profundamente el proceso que estás intentando automatizar. No hay atajos aquí.

El investigador también mostró a Business Insider cómo uno de sus agentes logra agregar noticias sobre temas geopolíticos, como el cese al fuego entre EE.UU. e Irán, y proporcionar lecturas de mercado a partir de esa información. Otros son agentes de desarrollo que escriben código, y también hay un agente de crecimiento que propone pasos para aumentar una determinada métrica dentro de su empresa. Son aplicaciones prácticas y variadas, pero todas con el mismo principio: el humano sigue en el centro de la decisión.

La lección más valiosa de quien construyó la base de la IA generativa

Lo que la experiencia de Polosukhin deja como enseñanza más valiosa es que usar inteligencia artificial con madurez no significa usarla al máximo de su autonomía todo el tiempo. Significa usarla de forma estratégica, sabiendo dónde brilla, dónde necesita ayuda y cómo construir sistemas que saquen lo mejor de ambos mundos.

La IA todavía lucha con el sentido común, incluso mientras las conversaciones online sobre el tema pueden exagerar el progreso actual. Esta es una observación que viene de alguien que no está desde afuera comentando, sino desde adentro, construyendo y usando la tecnología a diario.

Los especialistas que llegaron a esta conclusión por cuenta propia, después de años trabajando con la tecnología en la práctica, suelen ser los mejores guías para quienes están comenzando este camino ahora. Y el mensaje central de Polosukhin es claro: pon a tus agentes a trabajar, pero mantén los ojos abiertos y el criterio activado. 🤖

Agentes de IA: ¿Por qué siguen necesitando supervisión humana?

Índice

El jefe de gabinete de un multimillonario: cómo un pionero de la IA pone a trabajar una docena de agentes

Una docena de agentes y una descripción bien directa en el prompt

Lo que Polosukhin hace diferente en el uso de agentes

Reciba el mejor contenido sobre innovación en su correo electrónico.

La sociedad no está preparada para la AGI, según Polosukhin

El problema de la confianza ciega en una única empresa

Por qué la infraestructura backend importa en esta ecuación

Del vibe coding a los agentes: la visión que vino de 2017

El papel del Transformer en esta nueva generación de agentes

Herramientas que usamos a diario

Qué cambia esto en la forma de pensar la automatización con IA

La lección más valiosa de quien construyó la base de la IA generativa

Rafael

CONTÁ
CTANOS

Publicaciones relacionadas

Las acciones de Amazon podrían subir tras la asociación con OpenAI.

Moratoria sobre los centros de datos de IA: El debate sobre la energía

Blockchain y los agentes de IA están cambiando los pagos con criptomonedas.

Receba o melhor conteúdo de inovação em seu e-mail

COMENZAR

PRODUCTOS

SERVICIOS

RECURSOS

Rafael

Calculadora de Precio de Sitios

Páginas del Sitio

Recursos del Sitio

Visitantes por mes

Automatización de Marketing

¿Cuál es el segmento del sitio?

Resultado de la Calculadora

Agentes de IA: ¿Por qué siguen necesitando supervisión humana?

Índice

El jefe de gabinete de un multimillonario: cómo un pionero de la IA pone a trabajar una docena de agentes

Una docena de agentes y una descripción bien directa en el prompt

Lo que Polosukhin hace diferente en el uso de agentes

Reciba el mejor contenido sobre innovación en su correo electrónico.

La sociedad no está preparada para la AGI, según Polosukhin

El problema de la confianza ciega en una única empresa

Por qué la infraestructura backend importa en esta ecuación

Del vibe coding a los agentes: la visión que vino de 2017

El papel del Transformer en esta nueva generación de agentes

Herramientas que usamos a diario

Qué cambia esto en la forma de pensar la automatización con IA

La lección más valiosa de quien construyó la base de la IA generativa

Rafael

CONTÁ CTANOS

Publicaciones relacionadas

Las acciones de Amazon podrían subir tras la asociación con OpenAI.

Moratoria sobre los centros de datos de IA: El debate sobre la energía

Blockchain y los agentes de IA están cambiando los pagos con criptomonedas.

Receba o melhor conteúdo de inovação em seu e-mail

Rafael

Calculadora de Precio de Sitios

Páginas del Sitio

Resultado de la Calculadora

Fale com um consultor

CONTÁ
CTANOS