Los agentes de IA están rediseñando internet y la nube necesita ponerse al día
Los agentes de inteligencia artificial lo están cambiando todo, y no hablamos solo de los modelos en sí, sino de toda la estructura que sostiene internet. La forma en que las aplicaciones se construyen, escalan y operan está siendo fundamentalmente desafiada por un nuevo tipo de software que no sigue ninguna de las reglas que aprendimos en los últimos quince años de computación en la nube.
La computación en la nube que conocemos hoy fue diseñada para un mundo donde los humanos acceden a aplicaciones, y no para un escenario donde millones de agentes autónomos ejecutan tareas simultáneamente, toman decisiones y consumen recursos de una forma completamente distinta a la de cualquier usuario humano.
Fue exactamente para responder a este nuevo escenario que Cloudflare lanzó la Agents Week, una semana entera dedicada a repensar la infraestructura de internet para la era de los agentes. La misión de la empresa siempre ha sido ayudar a construir una internet mejor, y esta vez eso significa construir para lo que viene después.
Y el timing no podría ser más relevante.
Cada semana surgen nuevos agentes de código, asistentes autónomos y herramientas que operan sin intervención humana constante, mientras la infraestructura que hay debajo todavía intenta encajar esta nueva realidad en moldes que fueron creados en la era de los smartphones. La nube, tal como la conocemos, nació del último gran cambio de paradigma tecnológico: la aparición de los smartphones, que pusieron internet en el bolsillo de todo el mundo y transformaron la naturaleza de lo que significaba estar conectado.
En este artículo vas a entender por qué este cambio es tan profundo, cuáles son los desafíos técnicos y económicos involucrados, y qué propone Cloudflare como solución para hacer que los agentes sean viables a escala global. 🚀
Internet y la nube no fueron construidas para la era de la IA
Cuando los smartphones pusieron internet en el bolsillo de todos, no solo añadieron usuarios. Cambiaron la naturaleza de lo que significaba estar conectado. Siempre en línea, siempre esperando una respuesta instantánea. Las aplicaciones tuvieron que lidiar con un orden de magnitud más de usuarios, y la infraestructura que las sostenía tuvo que evolucionar para aguantar ese nuevo volumen.
El enfoque que adoptó la industria fue directo: más usuarios, más copias de tu aplicación. Conforme las aplicaciones crecían en complejidad, los equipos las dividían en piezas más pequeñas, los famosos microservicios, para que cada equipo pudiera controlar su propio destino. Pero el principio central siguió siendo el mismo: un número finito de aplicaciones, cada una sirviendo a muchos usuarios. Escalar significaba más copias.
Kubernetes y los containers se convirtieron en el estándar. Facilitaron levantar instancias, distribuir carga y tumbar lo que ya no era necesario. En ese modelo de uno-para-muchos, una sola instancia podía servir a muchos usuarios, y aunque el número de usuarios llegara a miles de millones, la cantidad de cosas que necesitabas gestionar seguía siendo finita.
Los agentes rompen esa lógica por completo.
Un usuario, un agente, una tarea
A diferencia de toda aplicación que vino antes que ellos, los agentes son uno-para-uno. Cada agente es una instancia única, sirviendo a un usuario, ejecutando una tarea. Mientras una aplicación tradicional sigue el mismo camino de ejecución independientemente de quién la esté usando, un agente exige su propio entorno de ejecución: uno donde el modelo de lenguaje dicta el camino del código, llama herramientas de forma dinámica, ajusta su enfoque y persiste hasta que la tarea esté completada.
Piensa en la diferencia entre un restaurante y un chef personal. Un restaurante tiene un menú, un conjunto fijo de opciones y una cocina optimizada para producirlas en volumen. Eso es la mayoría de las aplicaciones hoy. Un agente es más como un chef personal que pregunta: ¿qué quieres comer? Puede que necesite ingredientes, utensilios o técnicas completamente diferentes cada vez. No se puede operar un servicio de chef personal con la misma estructura de cocina que usarías para un restaurante.
En el último año vimos a los agentes despegar, con los agentes de código liderando el camino, lo cual no sorprende, ya que los desarrolladores suelen ser los primeros en adoptar nuevas tecnologías. La forma en que la mayoría de los agentes de código funciona hoy es levantando un container para darle al modelo de lenguaje lo que necesita: un sistema de archivos, git, bash y la capacidad de ejecutar binarios arbitrarios.
Pero los agentes de código son solo el comienzo. Herramientas como Claude Cowork ya están haciendo que los agentes sean accesibles para usuarios menos técnicos. Cuando los agentes salgan de las manos de los desarrolladores y lleguen a las de todo el mundo — asistentes administrativos, analistas de investigación, agentes de soporte, organizadores personales — las matemáticas de escala se vuelven terroríficas bastante rápido. 🤯
Las matemáticas de escalar agentes para las masas
Si los más de 100 millones de trabajadores del conocimiento en Estados Unidos usaran cada uno un asistente agéntico con alrededor de un 15% de concurrencia, necesitarías capacidad para aproximadamente 24 millones de sesiones simultáneas. Con 25 a 50 usuarios por CPU, eso da algo entre 500 mil y 1 millón de CPUs de servidor — solo para EE.UU., con un agente por persona.
Ahora imagina que cada persona ejecute varios agentes en paralelo. Ahora imagina el resto del mundo, con más de 1.000 millones de trabajadores del conocimiento. No estamos un poco lejos de tener computación suficiente. Estamos a órdenes de magnitud de distancia.
Entonces, ¿cómo cerramos esa brecha?
Infraestructura construida para agentes
Hace ocho años, Cloudflare lanzó Workers, el inicio de su plataforma de desarrollo y una apuesta por la computación serverless sin containers. La motivación en aquel momento era práctica: la empresa necesitaba computación ligera sin cold-starts para clientes que dependían de Cloudflare por velocidad. Construido sobre isolates V8 en vez de containers, Workers demostró ser un orden de magnitud más eficiente — más rápido para arrancar, más barato para ejecutar y nativamente adecuado para el patrón de levantar, ejecutar y tumbar.
Lo que Cloudflare no anticipó fue lo bien que ese modelo encajaría en la era de los agentes.
Donde los containers le dan a cada agente una cocina comercial completa — con electrodomésticos fijos, cámaras frigoríficas y todo lo demás, lo necesite el agente o no — los isolates, por otro lado, le dan al chef personal exactamente el espacio de encimera, el quemador y el cuchillo que necesita para esa comida en particular. Aprovisionados en milisegundos. Limpiados en el momento en que el plato se sirve.
En un mundo donde necesitamos soportar no miles de aplicaciones de larga duración, sino miles de millones de entornos de ejecución efímeros y de propósito único, los isolates son la primitiva correcta. Cada uno arranca en milisegundos. Cada uno está aislado de forma segura. Y puedes ejecutar órdenes de magnitud más de ellos en el mismo hardware comparado con containers.
Pocas semanas antes de la Agents Week, Cloudflare llevó esto más lejos con los Dynamic Workers en open beta: entornos de ejecución creados en tiempo de ejecución, bajo demanda. Un isolate tarda pocos milisegundos en arrancar y usa pocos megabytes de memoria. Eso es aproximadamente 100 veces más rápido y hasta 100 veces más eficiente en memoria que un container.
Puedes iniciar uno nuevo para cada solicitud, ejecutar un fragmento de código y descartarlo — a una escala de millones por segundo.
Para que los agentes salgan de los early adopters y lleguen a las manos de todos, también necesitan ser accesibles económicamente. Ejecutar cada agente en su propio container es lo suficientemente caro como para que las herramientas agénticas de hoy estén mayoritariamente limitadas a asistentes de código para ingenieros que pueden justificar el coste. Los isolates, al ejecutarse con órdenes de magnitud más de eficiencia, son lo que hace que la economía unitaria sea viable a la escala que los agentes exigen. 💡
La fase del carruaje sin caballos
Aunque es fundamental construir la base correcta para el futuro, todavía no hemos llegado. Y todo cambio de paradigma tiene un período donde intentamos hacer que la cosa nueva funcione dentro del modelo antiguo. Los primeros coches se llamaban carruajes sin caballos. Los primeros sitios web eran folletos digitales. Las primeras aplicaciones móviles eran interfaces de escritorio encogidas. Estamos en esa fase ahora con los agentes.
Se ve en todas partes.
Estamos dándole a los agentes navegadores headless para navegar por sitios diseñados para ojos humanos, cuando lo que necesitan son protocolos estructurados como el MCP para descubrir e invocar servicios directamente. Muchos servidores MCP iniciales son wrappers finos alrededor de APIs REST existentes — las mismas operaciones CRUD, nuevo protocolo — cuando los modelos de lenguaje son, en realidad, mucho mejores escribiendo código que haciendo llamadas secuenciales de herramientas.
Estamos usando CAPTCHAs y fingerprinting comportamental para verificar quién está al otro lado de una solicitud, cuando cada vez más esa entidad es un agente actuando en nombre de alguien — y la pregunta correcta no es ¿eres humano? sino ¿qué agente eres, quién te autorizó y qué tienes permiso para hacer?
Estamos levantando containers completos para agentes que solo necesitan hacer unas cuantas llamadas de API y devolver un resultado.
Nada de esto es sorprendente. Así es como funcionan las transiciones.
Construyendo para los dos mundos al mismo tiempo
Internet siempre está en algún punto entre dos eras. El IPv6 es objetivamente mejor que el IPv4, pero abandonar el soporte a IPv4 rompería la mitad de internet. HTTP/2 y HTTP/3 coexisten. TLS 1.2 todavía no ha cedido completamente ante el 1.3. La tecnología mejor existe, la tecnología antigua persiste, y el trabajo de la infraestructura es hacer de puente entre ambas.
Cloudflare siempre ha estado en el negocio de hacer ese puente durante las transiciones. El cambio hacia los agentes no es diferente.
Los agentes de código genuinamente necesitan containers — un sistema de archivos, git, bash, ejecución de binarios arbitrarios. Eso no va a desaparecer. Durante la Agents Week, los entornos sandbox basados en containers de Cloudflare entraron en disponibilidad general (GA), porque la empresa está comprometida en hacerlos lo mejores posibles. También están profundizando en el renderizado de navegador para agentes, porque habrá una larga cola de servicios que todavía no hablan MCP, y los agentes aún necesitarán interactuar con ellos.
Pero la empresa también está construyendo lo que viene después: los isolates, los protocolos y los modelos de identidad que los agentes realmente necesitan. El trabajo es garantizar que nadie tenga que elegir entre lo que funciona hoy y lo que es correcto para mañana.
Seguridad en el modelo, no alrededor de él
Si los agentes van a encargarse de nuestras tareas profesionales y personales — leer nuestros correos, operar en nuestro código, interactuar con nuestros servicios financieros — entonces la seguridad necesita estar integrada en el modelo de ejecución, no añadida como capa después.
Los CISOs fueron los primeros en confrontar esto. Las ganancias de productividad de poner agentes en las manos de todos son reales, pero hoy la mayoría de los despliegues de agentes están llenos de riesgos: inyección de prompt, exfiltración de datos, acceso no autorizado a APIs, uso opaco de herramientas.
Un agente de vibe-coding de un desarrollador necesita acceso a repositorios y pipelines de despliegue. Un agente de atención al cliente de una empresa necesita acceso a APIs internas y datos de usuarios. En ambos casos, proteger el entorno hoy significa coser credenciales, políticas de red y controles de acceso que nunca fueron diseñados para software autónomo.
Cloudflare viene construyendo dos plataformas en paralelo: su plataforma de desarrollo, para personas que construyen aplicaciones, y su plataforma zero trust, para organizaciones que necesitan proteger accesos. Durante un tiempo, estas plataformas servían a públicos distintos. Pero las preguntas ¿cómo construyo este agente? y ¿cómo garantizo que sea seguro? se están convirtiendo cada vez más en la misma pregunta. La empresa está uniendo estas plataformas para que todo esto sea nativo a la forma en que los agentes se ejecutan, no una capa separada que atornillas después. 🔐
Agentes que siguen las reglas
Existe otra dimensión de la era de los agentes que va más allá de la computación y la seguridad: economía y gobernanza.
Cuando los agentes interactúan con internet en nuestro nombre — leyendo artículos, consumiendo APIs, accediendo a servicios — tiene que existir una forma para que las personas y organizaciones que crean ese contenido y operan esos servicios definan términos y sean remuneradas. Hoy, el modelo económico de la web está construido alrededor de la atención humana: anuncios, paywalls, suscripciones.
Los agentes no tienen atención en el sentido humano. No ven anuncios. No hacen clic en banners de cookies.
Si queremos una internet donde los agentes puedan operar libremente y donde los editores, creadores de contenido y proveedores de servicios sean justamente compensados, necesitamos nueva infraestructura para eso. Cloudflare está construyendo herramientas que facilitan a los editores y propietarios de contenido definir y aplicar políticas sobre cómo los agentes interactúan con su material.
El año pasado, junto con Coinbase, Cloudflare cofundó la x402 Foundation, un estándar abierto y neutral que revive el código de estado HTTP 402, dormido durante mucho tiempo, para darle a los agentes una forma nativa de pagar por los servicios y contenidos que consumen. Identidad de agente, autorización, pago y seguridad: todo esto necesita estándares abiertos que ninguna empresa puede definir sola.
Construir una internet mejor siempre ha significado garantizar que funcione para todos — no solo para quienes construyen la tecnología, sino para las personas cuyo trabajo y creatividad hacen de internet algo que merece la pena usar. Eso no cambia en la era de los agentes. Se vuelve todavía más importante. 🌍
El coste real de ejecutar agentes en producción
Hay una conversación que ocurre mucho entre bastidores del desarrollo de productos con inteligencia artificial y que rara vez aparece en los comunicados oficiales: el coste de operación de agentes en producción puede ser sorprendentemente alto cuando la infraestructura no fue pensada para este tipo de workload. No es raro ver equipos de ingeniería sorprendidos con facturas de nube mucho mayores de lo esperado después de poner sus primeros agentes en operación real, incluso con volúmenes de uso relativamente modestos.
El problema tiene varias capas. La primera es el tiempo de ejecución: agentes que hacen razonamiento encadenado, consultan múltiples fuentes y toman decisiones complejas pueden ejecutarse durante minutos en vez de milisegundos, lo que invierte completamente la lógica de precios de las funciones serverless tradicionales, que fueron optimizadas para ejecuciones cortísimas. La segunda capa es el tráfico de datos: agentes que acceden a bases de conocimiento, llaman APIs externas y se comunican con otros agentes generan un volumen de transferencia de datos mucho mayor que una aplicación web convencional para el mismo número de usuarios finales.
La propuesta de Cloudflare para este problema pasa por un modelo de ejecución basado en isolates, que son drásticamente más baratos de operar porque consumen únicamente los recursos estrictamente necesarios para cada tarea. Los períodos de hibernación de un Durable Object, por ejemplo, no consumen recursos computacionales activos, lo que representa un ahorro significativo para agentes que pasan gran parte del tiempo esperando respuestas de APIs de terceros, modelos de lenguaje externos o acciones humanas dentro de un flujo de trabajo híbrido. 💰
Una plataforma para desarrolladores y agentes
La visión de Cloudflare para su plataforma de desarrollo siempre ha sido ofrecer una plataforma completa que simplemente funcione: del experimento al MVP, pasando por el escalado a millones de usuarios. Pero proporcionar las primitivas es solo parte de la ecuación. Una gran plataforma también necesita pensar en cómo todo funciona junto y cómo se integra al flujo de desarrollo.
Ese trabajo está evolucionando. Antes era puramente sobre experiencia del desarrollador, facilitando a los humanos construir, probar y publicar. Cada vez más, es también sobre ayudar a los agentes a ayudar a los humanos, y hacer que la plataforma funcione no solo para las personas que construyen agentes, sino para los propios agentes. ¿Puede un agente encontrar las mejores prácticas más actualizadas? ¿Con qué facilidad puede descubrir e invocar las herramientas y CLIs necesarias? ¿Qué tan fluida es la transición de escribir código a desplegarlo?
Durante la Agents Week, Cloudflare está entregando mejoras en ambas dimensiones — haciendo la plataforma mejor para los humanos que construyen sobre ella y para los agentes que se ejecutan en ella.
Construir el futuro es trabajo en equipo
Construir el futuro no es algo que se haga en solitario. Toda gran transición de internet — de HTTP/1.1 a HTTP/2 y HTTP/3, de TLS 1.2 a 1.3 — exigió que la industria convergiera en estándares compartidos. El cambio hacia los agentes no será diferente.
Cloudflare tiene un largo historial de contribuir y ayudar a impulsar los estándares que hacen que internet funcione. La empresa está involucrada con el IETF desde hace más de una década, ayudando a desarrollar e implementar protocolos como QUIC, TLS 1.3 y Encrypted Client Hello. Fue miembro fundador del WinterTC, el comité técnico de ECMA para interoperabilidad de runtimes JavaScript. Y liberó el runtime de Workers como código abierto.
La empresa está llevando el mismo enfoque a la era agéntica. Forma parte de la Linux Foundation y de la AAIF, y está ayudando a apoyar y avanzar estándares como el MCP que serán fundamentales para el futuro de los agentes. Desde que Anthropic introdujo el MCP, Cloudflare trabajó de cerca con ellos para construir la infraestructura para servidores MCP remotos, liberó sus propias implementaciones como código abierto e ha invertido en hacer que el protocolo sea práctico a escala.
Qué cambia para quienes están desarrollando con IA ahora
Si estás construyendo algo con agentes de inteligencia artificial hoy, ya sea un asistente autónomo, un pipeline de automatización o una herramienta que combina múltiples modelos, el mensaje principal de la Agents Week es que la infraestructura disponible está finalmente empezando a alinearse con las necesidades reales de estos sistemas. Esto no significa que los problemas se hayan resuelto de golpe, pero sí significa que existen ahora primitivas más adecuadas para trabajar, en vez de intentar adaptar soluciones que fueron creadas con otro propósito en mente.
La adopción del protocolo MCP como estándar de comunicación entre agentes y herramientas es particularmente relevante porque reduce la fragmentación del ecosistema. Cuando cada herramienta tiene su propia forma de ser accedida por un agente, el resultado es un código de integración frágil, difícil de mantener y lleno de casos especiales. Un estándar abierto cambia eso, y Cloudflare, al adoptar MCP nativamente en su plataforma, señala que está apostando por la consolidación de este ecosistema en vez de intentar crear un estándar propietario que encierre a los desarrolladores dentro de su propia infraestructura.
La computación en la nube está, en la práctica, pasando por una reformulación conceptual profunda. El modelo de solicitud y respuesta que dominó la última década y media está cediendo espacio a un modelo basado en agentes que persisten, razonan y actúan de forma continua. Y la infraestructura que va a soportar este nuevo modelo necesita ser pensada desde el inicio para ese propósito, con aislamiento real, ejecución eficiente y coste proporcional al uso real.
Internet no fue construida para la IA. La nube no fue construida para los agentes. Pero Cloudflare siempre ha tratado de ayudar a construir una internet mejor — y lo que mejor significa cambia con cada era. Esta es la era de los agentes, y la Agents Week es una apuesta clara de que ese futuro llegó antes de lo que mucha gente esperaba. 🌐
