La IA se llevó la culpa por el bombardeo de una escuela en Irán, pero la verdad es mucho más preocupante
En la primera mañana de la Operación Epic Fury, el 28 de febrero de 2026, fuerzas estadounidenses alcanzaron la escuela primaria Shajareh Tayyebeh, en Minab, en el sur de Irán, impactando el edificio al menos dos veces durante el horario lectivo de la mañana. Entre 175 y 180 personas murieron, la gran mayoría niñas de entre 7 y 12 años.
En pocos días, la pregunta que organizó toda la cobertura periodística era si Claude, un chatbot desarrollado por Anthropic, había seleccionado la escuela como objetivo. El Congreso de los Estados Unidos escribió al secretario de Defensa, Pete Hegseth, cuestionando el alcance del uso de inteligencia artificial en los ataques. La revista The New Yorker preguntó si Claude podía ser confiable para obedecer órdenes en combate, si podría recurrir al chantaje como estrategia de autopreservación y si la principal preocupación del Pentágono debería ser el hecho de que el chatbot tenía personalidad. Casi nada de eso tenía relación alguna con la realidad. El sistema de selección de objetivos de la Operación Epic Fury funcionaba sobre una plataforma llamada Maven. Nadie estaba discutiendo sobre Maven. 🎯
Qué es Maven y por qué nadie lo estaba mirando
Ocho años antes de la tragedia en Minab, Maven era el proyecto más controvertido de Silicon Valley. En 2018, más de 4.000 empleados de Google firmaron una carta oponiéndose al contrato de la empresa para construir inteligencia artificial para los sistemas de targeting del Pentágono. Trabajadores organizaron protestas. Ingenieros renunciaron. Y Google terminó abandonando el contrato.
Quien lo asumió fue Palantir Technologies, empresa de análisis de datos y contratista de defensa cofundada por Peter Thiel. A lo largo de los seis años siguientes, Palantir transformó Maven en una infraestructura de targeting que reúne imágenes satelitales, inteligencia de señales y datos de sensores para identificar objetivos y conducirlos por todas las etapas, desde la primera detección hasta la orden de ataque.
El edificio en Minab había sido clasificado como instalación militar en una base de datos de la Agencia de Inteligencia de Defensa que, según la CNN, no había sido actualizada para reflejar que el edificio fue separado del complejo adyacente de la Guardia Revolucionaria Islámica y convertido en escuela. Imágenes satelitales, según reportó la NPR, muestran que ese cambio había ocurrido como mínimo hacia 2016. Un chatbot no mató a esas niñas. Personas fallaron en actualizar una base de datos, y otras personas construyeron un sistema lo suficientemente rápido como para convertir esa falla en algo letal.
Cuando la guerra de Irán comenzó, Maven ya se había convertido en parte de la infraestructura militar, invisible como una tubería dentro de la pared, y toda la discusión giraba en torno a Claude. Esa obsesión funciona como una especie de psicosis colectiva sobre IA, aunque no del tipo que normalmente discutimos. Afecta tanto a los críticos como a los entusiastas de la tecnología con la misma intensidad. No necesitas usar un modelo de lenguaje para dejar que organice tu atención o distorsione tu pensamiento.
El poder de una tecnología carismática
En 2019, la investigadora Morgan Ames publicó The Charisma Machine, un estudio sobre cómo ciertas tecnologías atraen atención, recursos y atribución de mérito hacia sí mismas, desviando todo eso de todo lo demás. El marco habitual para entender esa dinámica es el concepto de hype, pero el hype describe solo lo que hacen los entusiastas y atribuye a los críticos un papel privilegiado de desenmascaramiento que aun así mantiene la tecnología en el centro de toda discusión. Una tecnología carismática moldea todo el campo a su alrededor, como un imán organiza limaduras de hierro. Los large language models pueden ser la instancia más poderosa de ese fenómeno en la historia.
Cuando la guerra comenzó, términos como AI safety, alignment, hallucination y stochastic parrots ya se habían convertido en el vocabulario obligatorio de cualquier debate sobre inteligencia artificial, estructurando y limitando lo que era posible decir. Peor aún: el propio término inteligencia artificial se había convertido en sinónimo de LLMs. Cuando la escuela fue bombardeada, fue ese el repertorio que las personas utilizaron, a pesar de que ese aparato crítico era inadecuado para el conjunto más antiguo y más maduro de tecnologías involucradas en el targeting militar.
La pregunta real, aquella que casi nadie hacía, no tiene que ver con Claude ni con ningún modelo de lenguaje. Es una pregunta burocrática sobre qué pasó con la kill chain, la cadena de eliminación. Y la respuesta es Palantir. 👇
La kill chain: de la artillería francesa al software de Palantir
En el lenguaje militar, kill chain es un término notablemente honesto. En esencia, se refiere al marco burocrático que organiza las etapas entre detectar algo y destruirlo. La referencia más antigua que se encuentra para el término en sí viene de los años 1990, pero la idea es bastante antigua, remontándose al menos a la década de 1760, cuando reformadores de la artillería francesa comenzaron a sustituir el ojo experimentado del artillero por tablas balísticas, tornillos de elevación y procedimientos de disparo estandarizados.
Las etapas de la kill chain están sujetas a cambios constantes, para acompañar alteraciones en la doctrina de targeting y también para incorporar cualquier moda de gestión que llegue a afligir a los pensadores estratégicos militares. Los militares de EE.UU. nombraron y renombraron las etapas durante 80 años. En la Segunda Guerra Mundial, la secuencia era find, fix, fight, finish. En la década de 1990, la Fuerza Aérea la había estirado a find, fix, track, target, engage, assess, o F2T2EA. Cada generación de tecnología militar fue vendida con la promesa de hacer todo en las kill chains más corto, excepto las siglas.
El Maven Smart System de Palantir es la iteración más reciente de esa compresión, y nació de un cambio en el pensamiento estratégico durante el segundo mandato de Obama. En 2014, el secretario de Defensa Chuck Hagel y su vicesecretario, Robert Work, anunciaron la llamada third offset strategy, o tercera estrategia de compensación. Un offset en esa lógica es una apuesta a que una ventaja tecnológica puede compensar una debilidad estratégica que el país no consigue resolver directamente.
Los dos primeros offsets abordaban el mismo problema: Estados Unidos no podía igualar a la Unión Soviética en fuerzas convencionales. Las armas nucleares, el primer offset, hicieron irrelevante la ventaja de personal en los años 1950. Cuando los soviéticos alcanzaron la paridad nuclear en los años 1970, las municiones guiadas de precisión y la tecnología stealth ofrecieron la promesa de que una fuerza menor podría derrotar a una mayor. En 2014, esa ventaja se estaba erosionando. China y Rusia habían pasado dos décadas adquiriendo municiones guiadas y construyendo sistemas de defensa diseñados para mantener a las fuerzas estadounidenses fuera de alcance. Robert Work insistió en que el tercer offset no era sobre ninguna tecnología específica, sino sobre usar tecnología para reorganizar cómo operaban los militares, permitiendo que EE.UU. tomara decisiones más rápido que China y Rusia.
Del dron al analista: el problema de la sobrecarga de información
En abril de 2017, al inicio del primer gobierno Trump, Work ayudó a establecer el Equipo Interfuncional de Guerra Algorítmica, designado Proyecto Maven. Uno de los generales que supervisaban Maven, el Teniente General Jack Shanahan, planteó el problema sin rodeos: miles de analistas de inteligencia pasaban el 80% de su tiempo en tareas mundanas, ahogados en grabaciones de drones de vigilancia que nadie tenía tiempo de ver. Una sola misión de un dron Predator podía generar cientos de horas de video. La premisa central del proyecto era que la máquina pudiera ver para que el analista pudiera pensar.
El Pentágono necesitaba a alguien para construirlo. Google aceptó el contrato, y lo que sucedió después se convirtió en la acción laboral más visible de la historia de Silicon Valley. Después de que Google abandonara el contrato, Palantir lo asumió en 2019.
Scarlet Dragon: de ejercicio de mesa a 1.000 objetivos por hora
El XVIII Cuerpo Aerotransportado comenzó a probar el sistema en un ejercicio llamado Scarlet Dragon, iniciado en 2020 como un wargame de mesa en un sótano sin ventanas en Fort Bragg. Su comandante, el Teniente General Michael Erik Kurilla, quería construir lo que llamó el primer cuerpo habilitado por IA en el Ejército. El objetivo era probar si el sistema podría dar a un pequeño equipo la capacidad de targeting que antes requería miles de personas.
A lo largo de los cinco años siguientes, Scarlet Dragon creció hasta convertirse en un ejercicio militar con munición real, abarcando múltiples estados y ramas de las fuerzas armadas, con ingenieros de Palantir y otros contratistas integrados junto a los soldados. Cada vez que el ejercicio se ejecutaba, debía responder a la misma pregunta: ¿qué tan rápido podía ir el sistema de la detección a la decisión?
El punto de referencia era la invasión de Irak en 2003, donde aproximadamente 2.000 personas trabajaban en el proceso de targeting para toda la guerra. Durante Scarlet Dragon, 20 soldados usando Maven manejaban el mismo volumen de trabajo. En 2024, la meta declarada era 1.000 decisiones de targeting por hora. Eso equivale a 3,6 segundos por decisión o, desde la perspectiva individual del operador, una decisión cada 72 segundos. 😳
Cómo funciona la interfaz de Maven en la práctica
La interfaz de Maven se parece a una versión militar de software de gestión de proyectos corporativos cruzado con una aplicación de mapas. Lo que el analista militar ve es un mapa con capas de datos de inteligencia o una pantalla organizada en columnas, cada una representando una etapa del proceso de targeting. Objetivos individuales se mueven por las columnas de izquierda a derecha conforme avanzan por cada etapa, en un formato tomado del Kanban, sistema de flujo de trabajo de manufactura esbelta desarrollado en Toyota y ampliamente utilizado en desarrollo de software.
Antes de Maven, los operadores trabajaban en ocho o nueve sistemas separados simultáneamente, extrayendo datos de uno, cruzando referencias en otro, moviendo detecciones manualmente entre plataformas. Maven consolidó todo eso en una única interfaz. Cameron Stanley, director jefe de digital e IA del Pentágono, llamó a esto capa de abstracción, término común en ingeniería de software que significa un sistema que oculta la complejidad que hay debajo de él.
Humanos conducen el targeting. Por debajo de la interfaz, sistemas de machine learning analizan imágenes satelitales y datos de sensores para detectar y clasificar objetos, puntuando cada identificación según cuán confiado está el sistema de haber acertado. Tres clics convierten un punto de datos en el mapa en una detección formal y lo mueven al pipeline de targeting. El sistema recomienda cómo atacar cada objetivo, qué aeronave, dron o misil usar, qué arma emparejar, y el oficial selecciona entre las opciones ranqueadas.
La IA detrás de la interfaz no es un modelo de lenguaje. Las tecnologías centrales son los mismos sistemas básicos que reconocen a tu gato en una biblioteca de fotos o permiten que un auto autónomo combine cámara, radar y lidar en una imagen única de la carretera, aplicados aquí a grabaciones de drones, radar e imágenes satelitales de objetivos militares. Preceden a los large language models por años. Ni Claude ni ningún otro LLM detecta objetivos, procesa radar, fusiona datos de sensores o empareja armas con objetivos.
Los LLMs son adiciones tardías al ecosistema de Palantir. A finales de 2024, años después de que el sistema central estuviera operativo, Palantir añadió una capa de LLM, que es donde encaja Claude, permitiendo que los analistas busquen y resuman reportes de inteligencia en lenguaje natural. Pero el modelo de lenguaje nunca fue lo que importaba en ese sistema. Lo que importaba era lo que Maven le hizo al proceso de targeting: consolidó los sistemas, comprimió el tiempo y redujo las personas.
La lección de Vietnam: cuando el sistema solo puede medirse a sí mismo
Esta no es una idea nueva. Los militares de EE.UU. intentan cerrar la brecha entre ver algo y destruirlo desde que esa brecha existe, y cada intento produjo el mismo tipo de falla.
A finales de los años 1960, EE.UU. enfrentó una versión del mismo problema en Vietnam. Los suministros se movían hacia el sur por la Ruta Ho Chi Minh a través de selva que los militares no podían ver. La solución fue la Operación Igloo White, un programa de mil millones de dólares al año que esparció 20.000 sensores acústicos y sísmicos a lo largo de la ruta. Esos sensores transmitían datos a aeronaves de retransmisión, que alimentaban las señales a computadoras IBM 360 en la base aérea de Nakhon Phanom, en Tailandia. Las computadoras analizaban los datos y predecían dónde estarían los convoyes, y aeronaves de ataque eran dirigidas a esas coordenadas.
El sistema podía sentir, pero no podía ver. Podía detectar una vibración, pero no distinguir un camión de un carro de bueyes. Los norvietnamitas se dieron cuenta. Reproducían grabaciones de motores de camión, conducían animales cerca de los sensores para activar la detección de vibración y colgaban baldes de orina en los árboles para disparar los detectores químicos. La Fuerza Aérea alegó que 46.000 camiones fueron destruidos o dañados a lo largo de la campaña. La CIA reportó que las cifras de un solo año excedían el número total de camiones que se creía existían en todo Vietnam del Norte. La propia salida del sistema era la única medida de su desempeño, y nadie de fuera tenía autoridad para cuestionarla. Cuando los vuelos de reconocimiento diurnos no encontraron los restos de todos esos camiones, el personal de la Fuerza Aérea inventó una criatura para explicar la ausencia. La llamaron el gran devorador de camiones laosiano.
Precisión de tiro, imprecisión de inteligencia
El patrón que se desarrolló en Vietnam, un sistema de targeting que solo podía medir su propio desempeño y terminó creyendo en su propia salida, es en realidad más antiguo que la computación digital. El historiador Michael Sherry, en su libro de 1987 The Rise of American Air Power, rastreó ese patrón hasta la doctrina fundadora del bombardeo de precisión, cuya confianza en sus propios métodos hacía innecesario examinar lo que esos métodos producían.
Carl von Clausewitz, el general prusiano del siglo 19 cuyos escritos permanecen como el fundamento del pensamiento militar occidental, tenía una palabra para todo lo que la optimización deja de lado. Lo llamaba fricción: la acumulación de incertidumbre, error y contradicción que garantiza que ninguna operación salga como fue planeada. Pero la fricción también es donde se forma el juicio. Clausewitz observó que la mayoría de la inteligencia es falsa, que los reportes se contradicen. El comandante que ha trabajado a través de eso aprende a ver como un ojo se ajusta a la oscuridad, no obteniendo mejor iluminación, sino permaneciendo el tiempo suficiente para usar la luz que existe.
Ese permanecer es lo que toma tiempo. Comprime el tiempo y la fricción no desaparece. Simplemente dejas de notarla.
Cuando la velocidad mata: el precedente de Irak en 2003
La invasión de Irak en 2003, la operación que Scarlet Dragon usaría como punto de referencia, fue un caso emblemático. Marc Garlasco, jefe de targeting de objetivos de alto valor del Pentágono durante la invasión, operó el ciclo de targeting más rápido que EE.UU. había ejecutado hasta entonces. Recomendó 50 ataques contra liderazgos iraquíes de alto rango. Las bombas fueron precisas, impactaron exactamente donde se apuntó, pero la inteligencia detrás de ellas no lo era. Ninguno de los 50 ataques mató a su objetivo pretendido.
Dos semanas después de la invasión, Garlasco dejó el Pentágono por Human Rights Watch, fue a Irak y se paró en el cráter de un ataque que él mismo había designado como objetivo. El ciclo de targeting había sido lo suficientemente rápido para impactar 50 edificios y demasiado rápido para descubrir que estaba impactando los edificios equivocados.
Jon Lindsay, que sirvió como oficial de inteligencia de la Marina en Kosovo y después estudió targeting de operaciones especiales en Irak, descubrió algo revelador. Una vez que un objetivo era reificado en una diapositiva de PowerPoint, el paquete de inteligencia de objetivo se convertía en una caja negra. Cuestionar las premisas detrás de él se volvía más difícil conforme la cacería ganaba impulso, conforme la carpeta engordaba con lo que Lindsay llama residuos representacionales. Había más maquinaria para construir un objetivo que para inspeccionar la calidad de su construcción.
Durante la guerra aérea en Kosovo, el General Wesley Clark exigió 2.000 objetivos. La CIA indicó solo un objetivo durante toda la guerra: el directorio federal de suministros y adquisiciones. Los analistas tenían una dirección, pero no coordenadas, así que intentaron hacer ingeniería inversa de la ubicación a partir de tres mapas desactualizados. Terminaron impactando la embajada de China, que se había mudado recientemente, a 300 metros del edificio que estaban apuntando. El Departamento de Estado sabía que la embajada se había mudado. La base de datos de instalaciones militares no. Lindsay llamó a esto reporte circular: una acumulación de documentos de apoyo que creaba la ilusión de múltiples validaciones mientras amplificaba un solo error. Lindsay, escribiendo en su diario en esa época, llamó al resultado un error inmenso, perfectamente empaquetado.
El efecto británico: cuando la lentitud salvaba vidas
En 2005, el Teniente Coronel John Fyfe, de la Fuerza Aérea de EE.UU., publicó un estudio sobre targeting sensible al tiempo durante la invasión de 2003. Fyfe destacó los diferentes enfoques de fuerzas británicas y estadounidenses. En el Centro Combinado de Operaciones Aéreas, oficiales de la RAF actuaban en posiciones de liderazgo junto a sus colegas estadounidenses, operando bajo reglas de enfrentamiento más restrictivas.
Fyfe notó que sus personalidades más reservadas y conservadoras producían lo que llamó un efecto amortiguador muy positivo en el ritmo a veces apresurado y caótico de las operaciones ofensivas. El contraste entre turnos era visible: líderes estadounidenses presionaban a toda velocidad, mientras oficiales británicos reconsideraban metódicamente riesgos y compensaciones de costo-beneficio antes de aprobar ejecuciones. En los turnos liderados por el Reino Unido, no hubo incidentes de fuego amigo ni daño colateral significativo.
Desde dentro del marco de eficiencia, cada característica que Fyfe describe era registrada como un defecto. Los turnos británicos eran más lentos. Las reglas de enfrentamiento restrictivas añadían restricciones. El efecto amortiguador añadía tiempo. La velocidad salva vidas, dice el argumento, pero el ciclo de targeting más rápido antes de Maven fue el de Garlasco, y acertó en 50 edificios sin alcanzar un solo objetivo pretendido. Scarlet Dragon eliminó todo eso: los desacuerdos sobre targeting, la deliberación, la vacilación y los momentos en que alguien tenía tiempo de objetar o notar algo mal.
El dilema burocrático: cuando el juicio humano se vuelve columna en un software
Las organizaciones que funcionan con procedimiento formal necesitan a alguien dentro del proceso para interpretar reglas, notar excepciones, reconocer cuándo las categorías ya no encajan con el caso. Si la organización admite que sus resultados dependen de la discreción de las personas que los ejecutan, entonces el procedimiento no es un procedimiento sino una sugerencia, y la autoridad que la organización deriva de parecer gobernada por reglas se desmorona. Así que el juicio tiene que ocurrir y tiene que parecer otra cosa. Tiene que parecer seguir el procedimiento en vez de interpretarlo.
El historiador de la ciencia Theodore Porter argumentó en su libro de 1995, Trust in Numbers, que las organizaciones adoptan reglas cuantitativas no porque los números sean más precisos, sino porque son más defendibles. El juicio es políticamente vulnerable. Las reglas no lo son. El procedimiento existe para hacer que la discreción desaparezca, o parezca que desapareció.
En 1984, el historiador David Noble mostró que cuando los militares estadounidenses y los fabricantes automatizaron sus plantas de producción, eligieron consistentemente sistemas que eran más lentos y más caros, pero que movían la toma de decisiones lejos de los trabajadores y hacia la dirección. El punto no era la eficiencia, frecuentemente era extremadamente derrochador, sino el control.
Alex Karp, CEO de Palantir, describe exactamente ese logro en su libro de 2025, The Technological Republic. Escribe que el software ahora está al mando, con el hardware sirviendo como medio por el cual las recomendaciones de la IA se implementan en el mundo. Su modelo para cómo debería funcionar esto viene de la naturaleza: enjambres de abejas y murmuraciones de estorninos. Ninguna mediación de la información capturada por los exploradores cuando regresan a la colmena, escribe Karp. Sin informes semanales para la gerencia intermedia, sin presentaciones para líderes más senior, sin reuniones para preparar otras reuniones.
Eso suena liberador, hasta utópico. Pero la señal que pasa sin mediación es también la señal que nadie puede cuestionar.
Karp piensa que está destruyendo burocracia. En realidad, la está codificando. El desprecio por reuniones e informes semanales, él trata eso como el proceso burocrático en sí. No lo es. Era donde las personas interpretaban el procedimiento, el lugar donde alguien podía notar cuándo las categorías ya no encajaban con el caso. Lo que Karp eliminó fue la discreción de la que la institución nunca pudo admitir que dependía. Lo que queda es una burocracia que puede ejecutar sus reglas, pero sin nadie para interpretarlas. La burocracia codificada en software no se dobla. Se hace añicos. 💥
El paquete de objetivo que se veía como todos los demás
El paquete de objetivo para la escuela Shajareh Tayyebeh presentaba una instalación militar. Lucy Suchman, cuyo libro de 1987 Plans and Situated Actions permanece como el análisis más agudo de cómo los procedimientos formales ocultan el trabajo que realmente produce sus resultados, no se habría sorprendido. Los planes siempre parecen completos después. Alcanzan esa completitud filtrando todo lo que no era legible para sus categorías.
Ese paquete se veía como todos los demás paquetes en la fila. Pero fuera del paquete, la escuela aparecía en listados comerciales iraníes. Era visible en Google Maps. Un motor de búsqueda podría haberla encontrado. Nadie buscó. A 1.000 decisiones por hora, nadie iba a buscar. Un exfuncionario senior del gobierno hizo la pregunta obvia: el edificio estaba en una lista de objetivos desde hacía años, sin embargo esto pasó desapercibido, y la cuestión es cómo.
El Congreso no autorizó esa guerra. En dos semanas, fuerzas estadounidenses alcanzaron 6.000 objetivos. La escuela fue uno de ellos. Fuerzas estadounidenses mataron a casi 200 personas, y la cobertura periodística recurrió a la etiqueta de error de IA, que domesticó el evento en algo que un mejor algoritmo o mejores salvaguardas podrían haber prevenido.
Lo que la discusión sobre Claude esconde
En los días posteriores al ataque, el carisma de la IA organizó toda la conversación política en torno a la tecnología: si Claude alucinó, si el modelo estaba alineado, si Anthropic tenía responsabilidad por su implementación. La cuestión constitucional de quién autorizó esa guerra y la cuestión legal de si ese ataque constituye un crimen de guerra fueron desplazadas por una cuestión técnica que es más fácil de hacer e imposible de responder en los términos en que fue planteada. El debate sobre Claude absorbió la energía. Eso es lo que hace el carisma.
Y eso también oscureció algo más profundo: las decisiones humanas que llevaron a la muerte de entre 175 y 180 personas, la mayoría de ellas niñas de entre 7 y 12 años. Alguien decidió comprimir la kill chain. Alguien decidió que la deliberación era latencia. Alguien decidió construir un sistema que produce 1.000 decisiones de targeting por hora y llamarlas de alta calidad. Alguien decidió empezar esa guerra. Cientos de personas están sentadas en el Capitolio, negándose a detenerla.
Llamar a esto un problema de IA le da a esas decisiones, y a esas personas, un lugar donde esconderse. 🕊️
Una versión anterior de este artículo fue publicada en Artificial Bureaucracy, Substack de Kevin T Baker.
