Para compartir:

Índice

Agentes de IA en Silicon Valley: entre tokens desperdiciados y sistemas caóticos

Los agentes de inteligencia artificial se convirtieron en los favoritos de las reuniones de C-level en todo el mundo. CEOs entusiasmados, presentaciones llenas de promesas y la sensación de que la empresa que no adopte esta tecnología se va a quedar atrás. Pero mientras los ejecutivos celebran, quienes están en la primera línea — ingenieros y desarrolladores — cuentan una historia bastante diferente.

Esta semana, dos eventos separados en Silicon Valley arrojaron luz sobre lo que realmente está pasando detrás de escena con los agentes de IA: sistemas inestables, costos operativos que nadie incluye en el pitch deck y una complejidad que puede convertir la solución en un problema todavía mayor. 😬

De San Jose a Mountain View, ingenieros de Google, Amazon, Microsoft y Meta, además de fundadores de startups, fueron sorprendentemente honestos sobre los desafíos que todavía necesitan resolverse antes de que esta tecnología realmente entregue lo que promete.

Y el OpenClaw, esa herramienta que Jensen Huang llamó el próximo ChatGPT, está justo en el centro de esta conversación — tanto como protagonista como blanco de críticas duras de parte de quienes intentan hacer que todo funcione en entornos corporativos reales.

El problema de los tokens desperdiciados

Uno de los momentos más destacados de la semana ocurrió durante el Generative AI and Agentic AI Summit en San Jose. Kevin McGrath, CEO de la startup de IA Meibel, fue directo al grano al describir lo que considera el mayor problema que la industria enfrenta ahora mismo con los agentes de IA.

Según McGrath, existe una mentalidad equivocada de que absolutamente todo necesita ser procesado por un modelo de lenguaje grande, los famosos LLMs. La metáfora que usó es ilustrativa: las empresas están básicamente entregando todos sus tokens y todo su dinero a bots que simplemente desperdician millones y millones de tokens sin necesidad.

El punto central no es que los modelos de lenguaje sean malos. Es que no toda tarea necesita pasar por un LLM. Muchas operaciones pueden resolverse con lógica convencional, reglas de negocio simples o herramientas más livianas. Cuando le tirás todo a un modelo generativo para que lo resuelva, el resultado es una factura de infraestructura que se dispara sin que la calidad de la salida mejore proporcionalmente. McGrath sostuvo que las empresas necesitan ser mucho más deliberadas al decidir qué tareas son realmente adecuadas para agentes de IA y cuáles se resuelven mejor con enfoques tradicionales.

Esta intervención resonó con fuerza entre los ingenieros presentes. La narrativa que llega en los decks ejecutivos es siempre la misma: el agente de IA va a automatizar tareas complejas, reducir el tiempo de respuesta, eliminar etapas manuales y, por supuesto, recortar costos. Suena irresistible. Pero cuando te sentás con los equipos de ingeniería que están efectivamente construyendo y manteniendo estos sistemas, el panorama cambia bastante.

Complejidad que roza el caos

Si la cuestión de los tokens desperdiciados fue uno de los temas fuertes, la complejidad operativa de los agentes de IA fue el otro gran protagonista de la semana.

Deep Shah, ingeniero de software de Google, lideró una sesión enfocada en nuevas técnicas para gestionar los costos operativos de correr grandes cantidades de agentes de IA simultáneamente. Shah fue claro al enumerar los desafíos: cuando intentás poner un sistema multi-agentes a escala, el primer obstáculo que aparece es el costo de inferencia. Y no es menor.

Reciba el mejor contenido sobre innovación en su correo electrónico.

Todas las noticias, consejos, tendencias y recursos que buscas, directamente en tu bandeja de entrada.

Al suscribirte al boletín informativo, aceptas recibir comunicaciones de Método Viral. Nos comprometemos a proteger y respetar siempre tu privacidad.

Cuesta dinero correr agentes de IA. Un sistema mal diseñado o mal monitoreado para acompañar a estos asistentes digitales y sus acciones puede terminar quemando caja en vez de ahorrar. Esto no es teoría — es la realidad que los equipos de ingeniería de Google y de la unidad DeepMind enfrentan en el día a día.

Ravi Bulusu, CEO de la startup Synchtron, amplió esta discusión al señalar la raíz del problema: la complejidad interdependiente. Explicó que, cuando mirás una empresa real, existen múltiples dimensiones en juego — cómo se organizan los datos, qué plataformas tecnológicas se usan, cómo se construye y mantiene el software, y cómo está estructurada la fuerza laboral.

Correr agentes de IA impacta significativamente todas estas dimensiones al mismo tiempo. Y como Bulusu planteó de forma bastante directa: ninguna dimensión aislada resuelve el problema, y las interdependencias son lo que hace que todo esto sea difícil — en realidad, caótico.

Esa palabra — caótico — quedó resonando en los pasillos del evento. Y no vino de un crítico externo. Vino de alguien que está construyendo herramientas para este ecosistema.

OpenClaw: revolución para unos, dolor de cabeza para otros

El OpenClaw llegó a las conversaciones de esta semana con esa energía de producto que todo el mundo quiere entender, pero pocos logran explicar bien todavía. Desde su aparición reciente, OpenClaw se posicionó como una especie de harness — una capa que permite a los desarrolladores usar varios modelos de IA para crear y gestionar flotas de asistentes digitales. La industria tecnológica rápidamente abrazó la herramienta y comenzó a impulsar los agentes de IA como la próxima gran evolución.

El CEO de NVIDIA, Jensen Huang, le dijo en marzo al periodista Jim Cramer, de CNBC, que OpenClaw es definitivamente el próximo ChatGPT. Una declaración de peso que naturalmente generó aún más entusiasmo alrededor de la tecnología.

Pero el jueves, durante un evento de IA realizado en Mountain View, California, OpenClaw recibió una evaluación bastante más sobria. El evento contó con la participación de ThinkingAI y MiniMax, ambas con sede en Shanghái, China.

ThinkingAI pasó recientemente por un rebranding. Antes conocida como ThinkingData, una empresa enfocada en analytics para juegos móviles, se reposicionó como una plataforma de gestión de agentes de IA. Como parte de esta transformación, ThinkingAI estableció una alianza con MiniMax, que salió a bolsa en Hong Kong en enero. MiniMax es uno de los laboratorios de IA más importantes de China, habiendo liberado modelos poderosos de forma gratuita para la comunidad open-source y consolidándose como uno de los llamados Tigres de la IA del país.

Chris Han, cofundador de ThinkingAI, explicó que el cambio de foco hacia la gestión de agentes de IA forma parte de un esfuerzo por expandirse más allá del sector de videojuegos y alcanzar otras industrias entusiasmadas con los agentes, pero que todavía no tienen la expertise técnica necesaria.

Y fue Han quien hizo la evaluación más directa sobre OpenClaw. A pesar de la creciente popularidad de la herramienta en China, afirmó que es demasiado complicada y propensa a fallas de seguridad para uso empresarial.

En sus palabras: OpenClaw es una buena herramienta para uso personal, pero definitivamente no logra alcanzar el nivel corporativo. Para llegar al nivel empresarial, hay que resolver muchas cuestiones — memoria, cómo gestionar tus agentes, equipos, comunicaciones. Son muchas piezas que necesitan encajar.

Esta declaración es significativa porque viene de alguien que está construyendo un producto competidor, pero también de alguien que trabaja directamente con los dolores prácticos de la implementación. La crítica no es al concepto en sí, sino a la madurez de la herramienta para entornos donde las fallas pueden tener consecuencias reales y serias.

La cuestión geopolítica de los modelos chinos

Otro tema que surgió de forma inevitable durante el evento de Mountain View fue la dimensión geopolítica. Con empresas chinas como ThinkingAI y MiniMax cada vez más presentes en el ecosistema global de IA, la pregunta sobre posibles restricciones del gobierno de Estados Unidos a modelos de IA chinos sobrevoló las discusiones.

Chris Han optó por no comentar sobre posibles preocupaciones de seguridad nacional que involucren modelos de IA chinos y que pudieran impactar la estrategia de ThinkingAI. Sin embargo, se encargó de destacar que el servicio de la empresa también soporta modelos de compañías como OpenAI y Google, lo que muestra una estrategia de flexibilidad y adaptación a escenarios regulatorios diversos.

En tono humorístico, Han bromeó diciendo que si el gobierno estadounidense decidiera prohibir modelos de IA chinos open-weight en el país, él lo interpretaría como una señal positiva. Si eso llega a pasar, tal vez signifique que estamos teniendo éxito, dijo, arrancando risas de la audiencia. 😄

Detrás del chiste, hay un punto estratégico relevante. La carrera por la IA no es solamente tecnológica — es también una disputa por influencia y estándares de mercado. Las empresas que logren ofrecer flexibilidad para trabajar con modelos de distintos orígenes se posicionan mejor para navegar cualquier escenario regulatorio que surja.

Costos operativos: el elefante en la habitación

Si hay un tema que atravesó todos los paneles y conversaciones informales de esta semana, fue el de los costos operativos. Y no es difícil entender por qué. 💸

Cuando una empresa decide poner agentes de IA en producción, rara vez dimensiona correctamente el costo total de esa decisión. El costo del modelo de lenguaje en sí es solo la punta del iceberg. Debajo están:

  • Costos de almacenamiento de contexto y memoria
  • Llamadas de API a herramientas externas
  • Infraestructura de monitoreo y observabilidad
  • Tiempo de ingeniería para mantener y ajustar prompts y configuraciones
  • Pruebas continuas para garantizar que el comportamiento del agente no se degradó después de actualizaciones
  • Costo de retrabajo e impacto en el cliente final en caso de fallas

Todo esto junto puede convertir una tecnología aparentemente barata en uno de los mayores centros de costo de la operación. Deep Shah, de Google, fue bastante enfático al colocar el costo de inferencia como el primer obstáculo que aparece a escala, pero es apenas el inicio de una lista larga.

Herramientas que usamos a diario

La observación de McGrath sobre los tokens desperdiciados cobra aún más peso en este contexto. Cada llamada innecesaria a un LLM es dinero tirado a la basura. Multiplicado por miles de ejecuciones diarias, en cientos de agentes corriendo simultáneamente, el desperdicio puede alcanzar proporciones alarmantes. La complejidad de poner estos sistemas a funcionar de forma confiable en contextos reales todavía es masivamente subestimada por muchas herramientas de ventas y proveedores de plataforma.

El punto más relevante planteado a lo largo de la semana fue la necesidad de un modelo de evaluación de ROI específico para agentes de IA. Este modelo necesita tener en cuenta no solo el ahorro directo generado por la automatización, sino también el costo de falla, el costo de supervisión humana necesaria para validar las salidas del agente, y el costo de adaptación continua del sistema a medida que el contexto de negocio cambia. Sin esto, las empresas seguirán tomando decisiones basadas en benchmarks de laboratorio que no reflejan la realidad de producción.

Confiabilidad e imprevisibilidad de los agentes

Un punto planteado repetidamente en ambos eventos fue la cuestión de la confiabilidad. A diferencia de un software tradicional, donde el comportamiento esperado es determinístico, los agentes de IA operan con una dosis considerable de imprevisibilidad. Pueden tomar decisiones inesperadas, interpretar instrucciones de formas que el desarrollador no anticipó o simplemente quedarse atrapados en un ciclo de razonamiento sin salida.

Lidiar con estos escenarios exige una capa robusta de observabilidad y mecanismos de fallback. Y esa capa, por sí sola, ya representa un proyecto técnico y un costo significativo. No es algo que se agrega después como un parche — necesita estar en la arquitectura desde el principio.

Los ingenieros de Google y de DeepMind que participaron del summit en San Jose dejaron claro que crear y operar agentes de IA no es una tarea simple. El entusiasmo del C-level necesita ser atemperado con la realidad técnica de quienes están haciendo que estas cosas funcionen en el día a día. Sin esa alineación, el riesgo de que los proyectos fracasen o revienten presupuestos es enorme.

Lo que viene por delante

Los eventos de esta semana dejaron una impresión clara: la inteligencia artificial aplicada a agentes autónomos no es una promesa falsa, pero tampoco es una solución lista para enchufarse en cualquier operación sin fricción. La maduración está ocurriendo, las herramientas están evolucionando, y discusiones como las que tuvieron lugar en Silicon Valley son exactamente el tipo de conversación que el sector necesita tener con mayor frecuencia — con menos hype y más ingeniería honesta.

El mensaje más fuerte que quedó fue el de Kevin McGrath: las empresas necesitan ser más deliberadas a la hora de decidir qué realmente merece ser procesado por un agente de IA y qué puede resolverse de formas más simples y baratas. Parece obvio, pero en medio de la euforia colectiva, lo obvio se ignora con frecuencia.

OpenClaw aparece como una pieza interesante en este tablero, pero carga consigo limitaciones que todavía necesitan ser abordadas para un uso corporativo serio. ThinkingAI y MiniMax representan un frente chino cada vez más relevante en el ecosistema global de agentes, y la forma en que la geopolítica va a moldear este mercado sigue siendo una incógnita.

Lo que queda como lección práctica para quienes están siguiendo este mercado de cerca es que los costos operativos y la complejidad de los agentes de IA necesitan entrar en la conversación desde el primer día de planificación, no después de que el proyecto está en producción y los problemas empiezan a aparecer. Las empresas que logren equilibrar ambición tecnológica con rigor de implementación son las que van a transformar el potencial de los agentes de inteligencia artificial en ventaja competitiva real — sin sorpresas desagradables en el camino. 🚀

Imagen de Rafael

Rafael

Operaciones

Transformo los procesos internos en máquinas de entrega, garantizando que cada cliente de Viral Method reciba un servicio de primera calidad y resultados reales.

Rellena el formulario y nuestro equipo se pondrá en contacto contigo en un plazo de 24 horas.

Publicaciones relacionadas

Las acciones de Amazon podrían subir tras la asociación con OpenAI.

Alianza entre Amazon y OpenAI podría impulsar ingresos de IA y valorizar acciones, dice Citi; impacto estratégico en AWS y

Moratoria sobre los centros de datos de IA: El debate sobre la energía

Moratoria: Sanders y AOC proponen pausa en construcción de centros de datos de IA en EE.UU. para evaluar impactos ambientales

Blockchain y los agentes de IA están cambiando los pagos con criptomonedas.

Agentes de IA impulsan pagos cripto con blockchain, stablecoins y x402, facilitando transacciones autónomas, micropagos y economía entre máquinas

Receba o melhor conteúdo de inovação em seu e-mail

Todas as notícias, dicas, tendências e recursos que você procura entregues na sua caixa de entrada.

Ao assinar a newsletter, você concorda em receber comunicações da Método Viral. A gente se compromete a sempre proteger e respeitar sua privacidade.

Rafael

Online

Atendimento

Calculadora de Precio de Sitios

Descubre cuánto cuesta el sitio ideal para tu negocio

Páginas del Sitio

¿Cuántas páginas necesitas?

Arrastra para seleccionar de 1 a 20 páginas

En solo 2 minutos, descubre automáticamente cuánto cuesta un sitio a medida para tu negocio

Más de 0+ empresas ya calcularon su presupuesto

Fale com um consultor

Preencha o formulário e nossa equipe entrará em contato.