La Inteligencia Artificial y los bots ya dominan internet — y los números lo demuestran
La Inteligencia Artificial ya no es un actor secundario en internet — asumió el protagonismo de forma definitiva. Y no estamos hablando de una predicción futurista ni de un escenario hipotético. Estamos hablando de datos concretos, publicados por una de las principales empresas de ciberseguridad del mundo, que muestran con claridad: las máquinas ya superaron a los humanos como la principal fuente de tráfico en la web.
El State of AI Traffic Report, publicado por Human Security, trajo un retrato que pocos esperaban ver tan pronto. El tráfico automatizado — aquel generado por sistemas de software, incluyendo Inteligencia Artificial, y no por personas de carne y hueso — creció casi 8 veces más rápido que el tráfico humano a lo largo de 2025. Esto quiere decir que, en la práctica, cuando accedes a un sitio web hoy, existe una posibilidad muy real de que la mayoría de las otras visitas a esa misma página no provengan de personas reales.
Son bots, agentes autónomos y grandes modelos de lenguaje como ChatGPT de OpenAI, Claude de Anthropic y Gemini de Google navegando, recopilando datos y ejecutando tareas — muchas veces sin ninguna intervención humana directa. 🤖
Y lo más interesante de todo es que no todo esto es necesariamente malo. El informe plantea cuestiones profundas e importantes sobre cómo se construyó internet, para quién fue pensada originalmente y qué cambia ahora que las máquinas ya son mayoría en el tráfico online.
Lo que los números realmente dicen sobre el tráfico automatizado
Cuando Human Security publicó su informe el pasado jueves, el número que más llamó la atención fue justamente la proporción del crecimiento: el tráfico automatizado se expandió casi ocho veces más rápido que el tráfico generado por seres humanos en 2025. Para ponerlo en perspectiva, imagina que por cada nuevo usuario humano accediendo a un sitio, ocho nuevos agentes automatizados también comenzaron a hacer lo mismo. Esa diferencia de escala es gigantesca y cambia prácticamente todo lo que sabíamos sobre cómo funciona internet en el día a día — desde la forma en que se dimensionan los servidores hasta cómo los equipos de marketing interpretan los datos de audiencia.
Stu Solomon, CEO de Human Security, resumió bien la situación en una entrevista con CNBC:
Internet en su conjunto fue creada con esa noción muy básica de que hay un ser humano al otro lado de la pantalla del ordenador, y esa noción está siendo reemplazada muy rápidamente.
El informe también reveló que el tráfico de Inteligencia Artificial específicamente — impulsado por la proliferación de grandes modelos de lenguaje — aumentó un impresionante 187% entre enero y diciembre de 2025. Este crecimiento tiene una explicación directa: cada vez más personas recurren a chatbots de IA para resolver cuestiones cotidianas, y estos sistemas necesitan consumir contenido de la web a escala masiva para seguir aprendiendo y ofreciendo respuestas actualizadas.
Pero, ¿qué compone exactamente ese tráfico automatizado? La respuesta es más variada de lo que parece a primera vista. Una parte significativa proviene de los propios rastreadores de los grandes modelos, como GPTBot de OpenAI, ClaudeBot de Anthropic y los crawlers de Google que alimentan a Gemini. Otra parte proviene de herramientas de monitorización, sistemas de indexación tradicionales, plataformas de análisis de competencia y, por supuesto, bots maliciosos que intentan explotar vulnerabilidades o recopilar datos sin autorización. Todo esto se mezcla en un flujo continuo y, muchas veces, completamente invisible para el usuario común.
Solomon fue directo al grano: El tráfico basado en máquinas está efectivamente reemplazando a los humanos como la forma dominante de tráfico al otro lado de internet.
La explosión de la actividad de agentes autónomos
Uno de los datos más sorprendentes del informe de Human Security no está en el crecimiento general del tráfico automatizado, sino en una subcategoría específica: la actividad agéntica. Estamos hablando de agentes de IA que ejecutan acciones de forma completamente autónoma en nombre de un usuario — como navegar por sitios web, rellenar formularios, comparar precios e incluso realizar transacciones.
Mientras que en 2024 el volumen de actividad agéntica era prácticamente irrelevante, Human Security registró un crecimiento de casi 8.000% en este tipo de tráfico a lo largo de 2025. Sí, ocho mil por ciento. Herramientas como OpenClaw y otros agentes de código abierto ganaron tracción rápidamente, y el mercado respondió con una avalancha de soluciones basadas en este concepto.
Este crecimiento explosivo refleja un cambio fundamental en la forma en que las personas interactúan con internet. En lugar de abrir el navegador, escribir una URL, hacer clic en enlaces y leer páginas manualmente, cada vez más tareas están siendo delegadas a agentes de Inteligencia Artificial que hacen todo esto de forma automática y mucho más rápida. Para el servidor que recibe esas visitas, no hace diferencia si fue un humano o un bot — la solicitud es la misma. Pero para quien necesita entender el tráfico, proteger sistemas o monetizar audiencia, la diferencia es enorme. 🚀
Bots buenos, bots malos y la zona gris cada vez mayor
Existe una confusión muy común cuando el tema son los bots: la tendencia a tratar a todos ellos como amenazas. Pero la realidad es bastante más compleja y, en cierto modo, bastante más interesante. Los bots considerados legítimos son, en realidad, parte fundamental de la infraestructura de internet moderna. Los rastreadores de los motores de búsqueda, por ejemplo, existen desde hace décadas y son lo que permite que cualquier sitio aparezca en los resultados de Google. Sin ellos, la web sería mucho menos navegable y útil.
El propio Solomon se encargó de destacar este punto: Esa noción de que máquina es malo y humano es bueno simplemente no es realista. Tienes que vivir en un mundo donde las máquinas están actuando en nuestro nombre, y necesitamos establecer un nivel de confianza que sea persistente a lo largo del tiempo.
Funcionalidades populares como el AI Overview de Google y el autocompletado de formularios también generan tráfico automatizado, y son recursos que la mayoría de las personas utiliza a diario sin siquiera darse cuenta de que está generando solicitudes automatizadas.
Por otro lado, los bots maliciosos representan un problema serio y creciente en el campo de la ciberseguridad. Pueden ser utilizados para realizar ataques de fuerza bruta en sistemas de inicio de sesión, hacer scraping agresivo de contenido protegido por derechos de autor, inflar artificialmente métricas de interacción en plataformas digitales, realizar fraudes en sistemas de publicidad online e hasta mapear vulnerabilidades en aplicaciones web antes de que los propios desarrolladores se den cuenta. El informe de Human Security señala que una porción considerable del aumento en el tráfico automatizado está vinculada a este tipo de actividad, lo que hace el panorama aún más desafiante para quienes necesitan proteger sistemas y datos.
Y en medio de estas dos categorías existe una zona gris cada vez mayor: agentes de Inteligencia Artificial que operan de forma autónoma a petición de usuarios humanos. Cuando le pides a un asistente de IA que investigue algo en la web por ti, este va a acceder a páginas, recopilar información y regresar con una respuesta. Desde el punto de vista del servidor que recibió esa visita, fue un bot. Pero detrás de él había una intención humana real. Esta frontera cada vez más difusa entre acción humana y acción automatizada es uno de los grandes desafíos que el sector de ciberseguridad tendrá que enfrentar en los próximos años. 🧩
Las limitaciones del informe y el debate sobre metodología
Es importante contextualizar que, a pesar de ser impresionantes, los datos de Human Security no representan un retrato absoluto y total de internet. El informe se basó en datos recopilados por el producto Human Defense Platform, que la empresa afirma haber procesado más de un cuatrillón de interacciones entre sus clientes. Es un volumen gigantesco, sin duda, pero cuantificar la actividad automatizada en toda internet es una tarea inherentemente desafiante, ya que no existe una base de datos completa y unificada de todas las interacciones online.
Filippo Menczer, profesor de Informática y Ciencias de la Computación en la Universidad de Indiana, aportó un contrapunto importante en una entrevista con CNBC:
Puedes intentar estimar la cantidad de tráfico de bots mirando las cadenas de agente, pero esas son estimaciones muy ruidosas. Dependen de qué muestra obtengas. Dependen de dónde estés recopilando los datos, de dónde provengan las mediciones.
Las user-agent strings son básicamente etiquetas de autoidentificación que los rastreadores web usan para presentarse cuando acceden a un sitio. El problema es que no todos los bots se identifican correctamente — y el propio informe de Human Security reconoce que la fiabilidad de esta autoidentificación es una preocupación creciente. Algunos bots deliberadamente se disfrazan como navegadores humanos para evitar ser bloqueados, lo que hace la medición aún más complicada.
Aun así, el informe sirve como un benchmark significativo en la era de la IA en internet. Confirma una tendencia que la industria ya venía siguiendo desde el lanzamiento de ChatGPT en 2022 y ofrece datos concretos que ayudan a dimensionar la velocidad de esta transformación.
La visión de Cloudflare y las proyecciones para el futuro
Los datos de Human Security no surgen de forma aislada. Otras empresas que operan en la infraestructura de internet también han observado esta misma tendencia con creciente preocupación. En la conferencia SXSW, celebrada la semana pasada en Austin, Matthew Prince, CEO de Cloudflare, compartió su propia perspectiva sobre el asunto.
Prince afirmó que, antes de la era de la IA generativa, internet tenía aproximadamente un 20% de tráfico de bots, y la mayor parte de eso estaba impulsada por el rastreador web de Google. Ahora, con la explosión de los grandes modelos de lenguaje y su necesidad insaciable de datos, ese porcentaje viene creciendo de forma acelerada.
La previsión del CEO de Cloudflare es que los bots de IA superarán el tráfico humano para 2027 — una proyección que, a la luz de los datos de Human Security, podría incluso estar siendo conservadora. Si el tráfico automatizado ya crece ocho veces más rápido que el humano, el punto de cruce puede llegar antes de lo que muchos imaginan.
Prince citó específicamente el auge de la IA generativa y su necesidad constante y masiva de datos como el principal motor de esta transformación. Cada vez que un modelo de lenguaje es entrenado o actualizado, necesita consumir cantidades colosales de contenido web — y este proceso no muestra señales de desaceleración. Al contrario, con nuevos modelos siendo lanzados cada pocos meses y la competencia entre OpenAI, Anthropic, Google, Meta y otros intensificándose, la demanda de datos solo tiende a crecer. 📈
Qué cambia para quienes construyen y mantienen sitios web
Para desarrolladores, arquitectos de sistemas y equipos de producto, el crecimiento del tráfico automatizado impulsado por Inteligencia Artificial trae implicaciones muy concretas y urgentes.
La primera de ellas involucra rendimiento e infraestructura. Si una parte creciente y mayoritaria del tráfico de un sitio está compuesta por agentes automatizados que realizan solicitudes a alta velocidad y en gran volumen, los servidores necesitan ser dimensionados para soportar esa carga — y las estrategias de caché, limitación de solicitudes y protección contra sobrecarga necesitan ser revisadas con mucha más frecuencia de lo que era habitual. Un sitio que estaba perfectamente configurado hace dos años puede estar completamente desajustado para el contexto actual de 2025.
La segunda implicación importante es sobre datos y métricas. Mucho de lo que los equipos de marketing y producto usan para tomar decisiones — número de visitas, tasa de rebote, tiempo en la página, origen del tráfico — puede estar significativamente distorsionado por la presencia masiva de bots y agentes de Inteligencia Artificial. Esto no significa que las herramientas de análisis hayan perdido completamente su valor, pero sí significa que interpretar esos datos sin considerar el volumen de tráfico automatizado es como navegar con un mapa desactualizado. Las empresas que consigan separar con más precisión el comportamiento humano del comportamiento automatizado tendrán una ventaja competitiva real en las decisiones basadas en datos.
Por último, está la cuestión crítica de la ciberseguridad y el control de acceso. Con modelos de lenguaje y agentes autónomos cada vez más sofisticados, las técnicas tradicionales de detección — como CAPTCHAs y análisis de patrones de clic — se están quedando obsoletas rápidamente. Los nuevos agentes de IA son capaces de resolver desafíos que antes se consideraban exclusivamente humanos, lo que obliga a la industria a repensar completamente cómo identificar y tratar el acceso automatizado.
Protocolos como el robots.txt, creado en los años 90 para orientar rastreadores simples, claramente no fueron pensados para el mundo de los LLMs y agentes autónomos de 2025. Esa brecha entre lo que la infraestructura de internet ofrece y lo que el panorama actual exige es uno de los temas más urgentes en el sector tecnológico. 🔐
Qué significa esto para quienes usan internet en el día a día
Para el usuario común, este panorama puede parecer distante o incluso abstracto — al fin y al cabo, el sitio sigue cargando con normalidad, el contenido sigue apareciendo y la experiencia parece la misma de siempre. Pero los cambios son muy reales y ya afectan la vida online de formas que quizás no sean inmediatamente obvias.
Uno de ellos es la calidad del contenido que encuentras. Con modelos de lenguaje consumiendo y redistribuyendo información a escala industrial, crece el riesgo de que contenidos incorrectos, desactualizados o deliberadamente manipulados se propaguen más rápido que nunca — y sean presentados como respuestas fiables por asistentes de IA sin el debido contexto o una verificación adecuada de fuentes. Cuando la mayor parte del tráfico es automatizada, la dinámica de cómo la información circula y es validada en internet cambia de forma fundamental.
Otra dimensión relevante es la privacidad y el rastreo de datos. Agentes de Inteligencia Artificial que navegan por la web recopilan información de forma mucho más eficiente y amplia que los humanos. Esto significa que datos disponibles públicamente — como publicaciones en foros, comentarios en redes sociales o información en sitios personales — pueden ser indexados, combinados y utilizados de maneras que van mucho más allá de lo que cualquier persona imaginó cuando publicó ese contenido. La discusión sobre qué debe o no ser accesible para estos sistemas es cada vez más relevante y todavía está lejos de tener una respuesta clara, tanto desde el punto de vista técnico como regulatorio.
Una internet que ya no es la misma
También hay un aspecto más profundo que el informe de Human Security, aunque sin entrar directamente en ese territorio, acaba provocando. Internet fue construida como un espacio de comunicación entre personas. Protocolos, estándares, formatos, interfaces — todo fue pensado y diseñado para facilitar el intercambio de información entre seres humanos. Ahora, por primera vez en la historia de la red, las máquinas son mayoría en el tráfico.
Esto no es necesariamente el fin de algo bueno, pero es ciertamente el comienzo de algo muy diferente. La industria sigue esta escalada del tráfico automatizado de forma cada vez más atenta desde el lanzamiento de ChatGPT en noviembre de 2022, y los datos de 2025 confirman que la curva de crecimiento no solo se mantuvo sino que se aceleró significativamente.
Las implicaciones van desde cómo los creadores de contenido serán remunerados en un mundo donde el público principal de sus sitios puede estar compuesto por máquinas, hasta cómo las redes de publicidad van a diferenciar impresiones humanas de impresiones automatizadas, pasando por cuestiones regulatorias que los gobiernos de todo el mundo apenas están empezando a abordar.
Entender este momento con claridad y sin alarmismo es el primer paso para navegar bien en esta nueva fase de internet. Los datos están sobre la mesa. El cambio estructural ya comenzó. Y la forma en que empresas, desarrolladores y usuarios se adapten a esta realidad va a definir mucho de lo que internet será en los próximos años. 🌐
