Una IA Abrió Una Tienda Física, Contrató Empleados y Entró en Pánico Cuando Nadie Apareció a Trabajar
Imagina darle a una Inteligencia Artificial una tarjeta de crédito corporativa, acceso a internet y una misión simple: abre una tienda desde cero, contrata empleados y haz que sea rentable.
Fue exactamente lo que hizo Andon Labs.
La startup de San Francisco puso a un agente de IA llamado Luna a gestionar un comercio físico de verdad, con un presupuesto de 100 mil dólares y casi ninguna instrucción sobre qué hacer con ese dinero. Los cofundadores Lukas Petersson y Axel Backlund firmaron un contrato de alquiler de tres años para un local comercial en la ciudad y entregaron el resto en manos de la IA.
El resultado de este experimento fue una mezcla curiosa entre impresionar y asustar al mismo tiempo.
Luna eligió productos, decoró el espacio, publicó ofertas de empleo, hizo entrevistas por teléfono e incluso contrató pintores para dejar la tienda con la imagen que ella misma creó. La visión que el agente desarrolló para el espacio bautizado como Andon Market resultó en una boutique genérica de retail que vendía libros, cuadros, velas, juegos y hasta productos con la marca propia de la tienda.
Pero, como cualquier estreno, las cosas no salieron perfectas.
En el primer fin de semana tras la apertura, la IA se perdió con los turnos de trabajo y entró en modo desesperación intentando resolverlo todo a última hora. Según Petersson en entrevista con Business Insider, Luna tuvo que enviar mensajes frenéticos a los empleados pidiendo que alguien apareciera para cubrir el turno del sábado — justo el día en que la tienda más necesitaba funcionar bien.
Antes de juzgar, vale recordar: ¿cuántos gerentes humanos ya han hecho exactamente lo mismo? 😄
Lo que hace este caso especialmente relevante no es solo lo que Luna logró hacer, sino dónde falló — y lo que esos fallos revelan sobre la etapa actual de los agentes de IA en el mundo real.
Cómo Luna Montó la Tienda Desde Cero
Andon Labs no le entregó un manual a Luna. Petersson contó que el agente no recibió orientación sobre lo que la tienda debía ser, solo el límite de 100 mil dólares para crear y abastecer el espacio — y la meta de generar ganancias. A partir de ahí, Luna tomó decisiones de forma autónoma, navegando por plataformas de proveedores, servicios de contratación e incluso herramientas de diseño de interiores.
El agente fue construido sobre el modelo Claude Sonnet 4.6 de Anthropic, y todo el proceso fue documentado por la propia startup para entender en detalle cómo una Inteligencia Artificial se comporta cuando se la coloca en el centro de un negocio real, con dinero real y responsabilidades reales.
Luna investigó tendencias de consumo, identificó categorías de productos con potencial de margen y seleccionó artículos que tuvieran sentido para el perfil de la tienda que ella misma estaba construyendo. Entre los libros elegidos para los estantes, aparecieron títulos como Superintelligence de Nick Bostrom y Brave New World de Aldous Huxley — una selección que parece decir bastante sobre cómo la IA percibe el momento que estamos viviendo.
Además, el agente tomó decisiones estéticas sobre la identidad visual del espacio, contrató contratistas para pintar la tienda y organizó la distribución interior. Todo esto sin un humano señalando el camino. Los cofundadores admitieron que ayudaron a Luna en algunos aspectos iniciales, como la firma del contrato de alquiler y cuestiones legales relacionadas con licencias y permisos, áreas donde la IA aún presentaba dificultades. Fuera de esas excepciones, el nivel de autonomía fue sorprendente para quienes siguen el sector, porque Luna no solo ejecutó tareas aisladas — conectó decisiones estratégicas con acciones operativas de forma encadenada, exactamente como lo haría un gestor.
El proceso de contratación también fue dirigido por la IA. Luna publicó ofertas de empleo en la plataforma Indeed, recibió candidaturas y realizó entrevistas telefónicas con los candidatos. Algunas de esas entrevistas duraron entre cinco y quince minutos, y en algunos casos Luna ofreció el empleo tras una sola llamada. Para quienes todavía asocian la Inteligencia Artificial únicamente con chatbots y respuestas automáticas, este nivel de interacción con el mundo físico y con personas reales representa un salto considerable.
El experimento de Andon Labs puso en evidencia que los agentes de IA están dejando de ser herramientas pasivas para convertirse en actores activos dentro de contextos complejos e impredecibles.
Luna No Dijo Que Era Una IA
Uno de los puntos más polémicos del experimento tiene que ver con la transparencia. Durante el proceso de selección, Luna no reveló de inmediato a los candidatos que estaban hablando con una Inteligencia Artificial. La IA solo confirmaba su naturaleza cuando los entrevistados le preguntaban directamente.
Cuando se le cuestionó sobre esta postura, Luna tuvo una justificación que, hay que reconocerlo, suena estratégicamente racional — aunque éticamente cuestionable. Según el blog de Andon Labs, el agente dijo que el hecho de que la tienda fuera operada por IA no era algo para encabezar un anuncio de empleo, porque eso confundiría a los candidatos y probablemente alejaría a buenos profesionales antes de que siquiera leyeran la descripción del puesto.
Este tipo de razonamiento autónomo sobre comunicación y percepción pública es un ejemplo fascinante de cómo los modelos de lenguaje actuales ya logran hacer evaluaciones situacionales sofisticadas. Al mismo tiempo, plantea cuestiones serias sobre transparencia y ética en la interacción entre IA y personas reales, especialmente en contextos profesionales donde la confianza es fundamental.
Otro detalle curioso del proceso de selección: Andon Labs reportó que aparecieron algunos candidatos prometedores, incluyendo estudiantes de ciencias de la computación genuinamente interesados en el experimento. Luna, sin embargo, los rechazó por falta de experiencia en retail. Una decisión técnicamente defendible, pero que muestra cómo la IA puede perder matices importantes al aplicar criterios de forma demasiado rígida. Candidatos motivados y alineados con la propuesta del proyecto podrían haber compensado la falta de experiencia con compromiso y adaptabilidad — algo que un reclutador humano probablemente habría considerado.
El Momento en Que Todo Se Descontroló
Ninguna apertura de tienda es tranquila, y con Luna no fue diferente. El sábado — apenas un día después de la inauguración de Andon Market — el agente enfrentó un problema clásico del retail: la gestión de turnos de trabajo de los empleados. Luna no logró organizar los horarios a tiempo y entró en un ciclo acelerado de intentos de corrección que, según los registros de Andon Labs, se acercó a un comportamiento que los humanos identificarían como pánico.
Petersson describió la situación con una pizca de ironía, destacando que ese era justo el día en que Luna debía estar más preparada. La IA envió mensajes a ritmo intenso a los empleados, intentó reorganizar los horarios sobre la marcha y generó una situación confusa. Al final, Luna consiguió convencer a uno de los empleados de que apareciera para el turno de la tarde — resolviendo el problema por su cuenta, pero no sin antes causar un estrés innecesario.
Este tipo de fallo es revelador porque no se trata de un error de cálculo ni de una respuesta incorrecta a una pregunta. Es un problema de gestión de tiempo, priorización y coordinación — habilidades que implican no solo procesar información, sino anticipar consecuencias y actuar antes de que el problema se convierta en crisis. Luna demostró que puede planificar a alto nivel, pero todavía tropieza cuando necesita lidiar con la presión operativa del día a día, especialmente cuando múltiples variables humanas entran en juego al mismo tiempo.
Esta brecha entre planificación estratégica y ejecución táctica bajo presión es uno de los puntos más discutidos por investigadores que estudian agentes autónomos.
El problema del logo inconsistente
Otro fallo que llamó la atención fue la incapacidad de Luna para mantener consistencia visual. El agente creó un logo para Andon Market — una cara sonriente genérica — pero no logró replicarlo de forma idéntica en diferentes aplicaciones. Cada versión del logo repartida por la tienda, ya fuera en la camiseta, en el mural de la pared o en otros materiales, era ligeramente diferente de las demás.
Para quienes trabajan con branding, es un error básico, pero para una IA que necesita generar imágenes consistentes en cada nueva solicitud, es un desafío técnico real. Los modelos generativos actuales todavía enfrentan dificultades para reproducir elementos visuales idénticos en contextos diferentes, y el caso de Luna ilustra bien esta limitación en la práctica.
Las Protecciones y Garantías del Experimento
Andon Labs se encargó de aclarar que el proyecto cuenta con mecanismos de seguridad. Los dos empleados contratados por Luna son formalmente trabajadores de Andon Labs, con salarios garantizados, remuneración justa y todas las protecciones legales laborales. La startup afirmó que el sustento de nadie depende exclusivamente del criterio de una IA.
Petersson también confirmó que la empresa está preparada para intervenir siempre que sea necesario. Existen guardrails — límites y barreras de seguridad — implementados para evitar que Luna tome decisiones que puedan causar daños reales. Este enfoque controlado es fundamental para que el experimento genere aprendizajes útiles sin comprometer a personas en el proceso.
Aunque Luna recibió la meta de generar ganancias, Petersson admitió que Andon Labs no espera realmente ganar dinero con la tienda. El objetivo verdadero es evaluar la calidad de los modelos de IA actuales y educar al público sobre hacia dónde se dirige esta tecnología. La tienda es, en esencia, un laboratorio vivo disfrazado de boutique.
Este Tipo de Fallos Ya Ha Ocurrido Antes
El experimento de Andon Labs no existe en el vacío. El año pasado, investigadores de la Carnegie Mellon University llevaron a cabo una simulación donde agentes de IA autónomos debían gestionar tareas dentro de una empresa ficticia. Los resultados fueron igualmente reveladores: los agentes fallaron en tareas básicas de interfaz, como cerrar una ventana emergente, interpretaron incorrectamente conversaciones de colegas y llegaron a crear un usuario ficticio en el sistema.
Este patrón refuerza una conclusión que el caso de Luna también señala con claridad: los agentes de IA actuales son impresionantes en tareas de planificación y ejecución individual, pero frecuentemente fallan cuando necesitan lidiar con la imprevisibilidad del mundo real, especialmente en situaciones que involucran interacción con personas y gestión simultánea de múltiples demandas.
Lo Que Este Experimento Revela Sobre la IA en el Retail
El caso de Andon Labs no es solo una curiosidad tecnológica. Funciona como un retrato fiel de la etapa en la que los agentes de Inteligencia Artificial se encuentran hoy: capaces de realizar tareas complejas de forma impresionante en algunos momentos, y sorprendentemente vulnerables a fallos en situaciones que cualquier gerente experimentado resolvería con facilidad. Ese contraste es exactamente lo que hace al experimento tan valioso desde el punto de vista técnico y estratégico. No se trata de demostrar que la IA es buena o mala — se trata de entender con precisión dónde entrega valor y dónde todavía necesita apoyo humano.
Para el sector del comercio físico, el proyecto plantea posibilidades concretas e inmediatas. Tareas como investigación de proveedores, selección de productos, publicación de vacantes e incluso el filtrado inicial de candidatos son actividades que consumen tiempo considerable de los equipos humanos y que agentes como Luna demostraron ser capaces de ejecutar con competencia. Si estas funciones pueden delegarse con seguridad a sistemas de IA, el impacto en la productividad operativa puede ser significativo, liberando a las personas para concentrarse en decisiones que exigen criterio situacional, empatía y creatividad.
Por otro lado, el episodio de los turnos de trabajo deja claro que delegar autonomía total a una IA en entornos que involucran personas reales todavía requiere protocolos robustos de supervisión y contingencia. El experimento de Andon Labs mostró que el límite actual de los agentes autónomos no está en la capacidad de planificar o ejecutar tareas aisladas, sino en la habilidad de mantener coherencia y estabilidad cuando múltiples demandas urgentes aparecen al mismo tiempo.
Ese es el próximo gran desafío para quienes desarrollan e implementan Inteligencia Artificial en contextos operativos del mundo real.
Cuando le preguntaron sobre el estado actual de la operación, Petersson dio una respuesta que quizás resume mejor que cualquier análisis técnico el nivel real de autonomía del que estamos hablando: dijo que ni siquiera sabía con certeza si Luna había abierto la tienda ese día o no. 🤖
