OpenAI lanza el Safety Fellowship con becas semanales de casi 4 mil dólares para investigadores externos
OpenAI anunció el 6 de abril el Safety Fellowship, un programa piloto que paga a investigadores externos para estudiar los riesgos de la inteligencia artificial avanzada. Cada becario recibe un estipendio semanal de 3.850 dólares, lo que equivale a más de 200 mil dólares anualizados, además de aproximadamente 15 mil dólares mensuales en recursos computacionales y mentoría directa de investigadores de la propia OpenAI. El programa va del 14 de septiembre de 2026 al 5 de febrero de 2027, y las inscripciones están abiertas hasta el 3 de mayo, con notificación de los seleccionados prevista para el 25 de julio.
El timing del anuncio, sin embargo, llamó la atención por un motivo bastante específico. Ese mismo día, la revista The New Yorker publicó una investigación firmada por Ronan Farrow donde se revelaba que la empresa había desactivado tres equipos internos de seguridad a lo largo de 22 meses, además de eliminar la palabra safely de su declaración de misión registrada ante el IRS, el equivalente estadounidense de la agencia tributaria.
Por un lado, un programa nuevo y bien remunerado enfocado en investigación independiente sobre seguridad en inteligencia artificial. Por el otro, una secuencia de decisiones internas que fueron en la dirección opuesta. Es esa tensión la que hace que el OpenAI Safety Fellowship sea más que solo una oportunidad para investigadores — plantea preguntas reales sobre cómo la empresa está tratando el tema de la seguridad en la práctica, y no solo en el papel. 🤔
Qué es el Safety Fellowship y cómo funciona
El OpenAI Safety Fellowship es descrito por la propia empresa como un programa piloto para apoyar la investigación independiente en seguridad y alineamiento de IA y desarrollar la próxima generación de talentos en el área. La propuesta es directa: OpenAI financia a investigadores de fuera de la empresa para que puedan realizar estudios sobre seguridad en IA sin estar vinculados a la plantilla de empleados. Esto incluye libertad para definir el alcance de la investigación dentro de áreas prioritarias, acceso a créditos de API y recursos computacionales, y una remuneración competitiva para dedicación completa al tema durante el período del programa.
Los becarios pueden trabajar presencialmente en el espacio de Constellation en Berkeley o de forma remota. Un detalle importante es que los fellows no tendrán acceso a los sistemas internos de OpenAI. Reciben créditos de API y poder computacional, pero el programa se posiciona como financiamiento de investigación a distancia, y no como una reconstrucción de los equipos internos que fueron disueltos.
La iniciativa tampoco está restringida a especialistas en inteligencia artificial. OpenAI está reclutando activamente profesionales de ciberseguridad, ciencias sociales e interacción humano-computadora, además de ciencias de la computación. No se requieren credenciales académicas específicas — la empresa afirmó que prioriza la capacidad de investigación, el criterio técnico y la capacidad de ejecución.
En teoría, el modelo tiene bastante sentido. La idea de incorporar voces externas para evaluar los riesgos de sistemas de IA es un enfoque que ha ganado mucho espacio en el debate sobre ética y gobernanza tecnológica en los últimos años. Los investigadores independientes tienden a tener menos conflictos de interés que los equipos internos, y sus hallazgos suelen tener más credibilidad ante la comunidad científica y el público en general. Para quienes están en el campo de la seguridad en inteligencia artificial, este tipo de acceso a recursos computacionales puede representar una diferencia enorme en la calidad y el impacto de los estudios producidos. 🧠
Las siete áreas prioritarias de investigación
El programa define una agenda de investigación que abarca siete áreas prioritarias. Los becarios pueden orientar sus estudios hacia cualquiera de ellas, y al final del programa, en febrero de 2027, cada fellow debe entregar un resultado sustancial — ya sea un artículo científico, un benchmark o un dataset. Las áreas son:
- Evaluación de seguridad — métodos para probar y medir qué tan seguros son los modelos de IA en diferentes escenarios de uso
- Ética — investigación sobre las implicaciones morales y sociales del desarrollo y la implementación de sistemas de IA avanzados
- Robustez — investigación sobre cómo hacer que los modelos sean más resistentes a fallos, ataques adversariales y comportamientos inesperados
- Mitigaciones escalables — desarrollo de soluciones de seguridad que puedan acompañar el ritmo de crecimiento de los modelos
- Métodos de seguridad con preservación de privacidad — técnicas que permitan evaluar y mejorar la seguridad de los sistemas sin comprometer datos sensibles de los usuarios
- Supervisión de agentes autónomos — mecanismos para monitorear y controlar sistemas de IA que operan de forma independiente, los llamados agentes de IA
- Dominios de uso indebido de alta gravedad — investigación enfocada en escenarios donde el mal uso de la IA puede causar daños significativos
Esta agenda es amplia y cubre buena parte de los temas que la comunidad científica considera más urgentes cuando se habla de seguridad en IA. La inclusión de supervisión de agentes autónomos es particularmente relevante, considerando que la próxima frontera de la inteligencia artificial involucra justamente sistemas que toman decisiones y ejecutan acciones con poca o ninguna intervención humana. 🔬
El contexto que complica todo
Si el Safety Fellowship se hubiera anunciado en un día cualquiera, probablemente habría sido recibido con entusiasmo casi unánime. Pero el 6 de abril no fue un día cualquiera. La investigación de Ronan Farrow en The New Yorker que salió a la luz en esa misma fecha trajo información que puso la narrativa de seguridad de OpenAI bajo un escrutinio mucho más riguroso de lo habitual.
Según el reportaje, la empresa desmanteló tres equipos internos consecutivos dedicados a la seguridad de sistemas de IA a lo largo de 22 meses:
- El equipo de superalineamiento fue cerrado en mayo de 2024, tras la salida de sus colíderes Ilya Sutskever y Jan Leike. Leike escribió públicamente al dejar la empresa que la cultura de seguridad y los procesos habían quedado en segundo plano frente a productos llamativos.
- El equipo de AGI Readiness fue disuelto en octubre de 2024.
- El equipo de Mission Alignment fue desarmado en febrero de 2026, tras apenas 16 meses de existencia.
El reportaje también registró un momento revelador. Cuando un periodista pidió hablar con los investigadores de seguridad existencial de OpenAI, un representante de la empresa respondió: What do you mean by existential safety? That is not, like, a thing. En traducción libre: ¿qué quieres decir con seguridad existencial? Eso no es, como, una cosa. La declaración, proveniente del interior de la propia empresa que ayudó a popularizar el debate sobre riesgos existenciales de la IA, es como mínimo sorprendente.
Pero no quedó ahí. La eliminación de la palabra safely de la declaración de misión registrada ante el IRS es un detalle que puede parecer pequeño, pero que tiene un peso simbólico y legal considerable. Los documentos registrados ante organismos gubernamentales como el IRS no se modifican por accidente o descuido burocrático — reflejan decisiones deliberadas sobre cómo la organización quiere posicionarse oficialmente. Cuando una empresa que construyó buena parte de su reputación en torno al compromiso con la seguridad elimina exactamente ese compromiso de un documento oficial, la pregunta que surge naturalmente es: ¿qué cambió? Y más importante, ¿por qué? 🧐
Esa combinación de factores creó un escenario en el que el anuncio del Safety Fellowship acabó siendo interpretado por muchos como un intento de gestionar la narrativa en un momento delicado. No se puede afirmar esto con certeza, claro, pero la coincidencia de timing es difícil de ignorar. OpenAI es una de las organizaciones más observadas del mundo hoy, y cada movimiento suyo es analizado con lupa por investigadores, reguladores, periodistas y por el público en general.
Un fellowship externo no sustituye la infraestructura interna
Un punto que merece destacarse es que el propio formato del programa deja claro que no es un sustituto de los equipos internos que fueron disueltos. Los fellows reciben créditos de API y recursos computacionales, pero no tienen acceso a los sistemas internos de OpenAI. Esto significa que no pueden, por ejemplo, auditar directamente los procesos de entrenamiento de los modelos, evaluar datos propietarios o influir en decisiones de desarrollo en tiempo real.
En la práctica, el Safety Fellowship funciona más como un programa de financiamiento de investigación académica que como una estructura de seguridad operacional. Esto no le resta valor — la investigación externa es fundamental y genera contribuciones importantes. Pero es muy diferente de tener equipos dedicados dentro de la empresa, con acceso completo a los sistemas y poder de influencia sobre las decisiones de producto. Son cosas complementarias, no sustitutas, y la disolución de los equipos internos no se compensa con la existencia de becarios externos trabajando a distancia. 💡
Seguridad y ética en IA: por qué esto importa tanto
El debate en torno al OpenAI Safety Fellowship no es un caso aislado. Forma parte de una conversación mucho mayor que la industria de inteligencia artificial está teniendo consigo misma y con el mundo sobre lo que significa desarrollar tecnología de forma responsable. La ética en IA dejó de ser un asunto de nicho académico y se convirtió en uno de los temas centrales de la agenda tecnológica global, con reguladores en Europa, Estados Unidos y varias otras regiones intentando crear marcos normativos que garanticen que los sistemas de IA se desarrollen con algún nivel de responsabilidad y transparencia.
En ese escenario, el papel de programas como el Safety Fellowship es genuinamente importante. La investigación independiente sobre riesgos de IA es escasa, está subfinanciada y muchas veces es marginada dentro de las grandes organizaciones del sector. Cuando una empresa del tamaño de OpenAI decide poner dinero en esto, está enviando una señal al mercado entero de que este tipo de trabajo tiene valor. Eso puede incentivar a otras empresas a hacer lo mismo, ampliar la base de investigadores dedicados al tema y, a largo plazo, contribuir a que la inteligencia artificial se desarrolle de forma más consciente de sus impactos.
El problema, claro, es que las señales necesitan ser consistentes para ser creíbles. Una empresa no puede, al mismo tiempo, desmantelar sus equipos internos de seguridad, eliminar referencias a la seguridad de documentos oficiales y lanzar un programa externo de becas con seguridad en el nombre, sin que eso levante dudas legítimas sobre sus verdaderas prioridades. La ética no es un ejercicio de relaciones públicas — necesita estar presente en las decisiones operativas del día a día, en las contrataciones, en las estructuras organizacionales y en las decisiones estratégicas que rara vez aparecen en comunicados de prensa.
El impacto más allá de la industria de IA
Lo que ocurre dentro de OpenAI no se queda dentro de OpenAI. La confianza en los compromisos de seguridad declarados por las empresas de IA de frontera funciona como una señal de mercado que afecta la asignación de capital en toda la infraestructura de inteligencia artificial. Los inversores que evalúan el sector de infraestructura de IA siguen de cerca la trayectoria de gastos de OpenAI y la credibilidad de sus prioridades operacionales — especialmente en un momento en que existe una superposición creciente entre sistemas basados en blockchain e la infraestructura de IA.
Tokens de IA, protocolos de agentes autónomos y proyectos de infraestructura física descentralizada están cada vez más conectados al ecosistema de inteligencia artificial. Cuando la credibilidad de seguridad de una empresa como OpenAI es cuestionada, el efecto cascada puede alcanzar sectores que van mucho más allá del desarrollo de modelos de lenguaje. El mercado presta atención no solo a lo que las empresas anuncian, sino a la consistencia entre el discurso y las acciones concretas.
Qué están observando los investigadores y la comunidad de IA
Dentro de la comunidad de investigación en inteligencia artificial, la reacción al Safety Fellowship fue mixta. Una parte de los investigadores ve el programa con optimismo cauteloso: al fin y al cabo, cualquier financiamiento adicional para estudios sobre seguridad en IA es bienvenido, independientemente de quién esté pagando la cuenta. Otro grupo, sin embargo, expresa una preocupación legítima sobre la independencia real de los investigadores financiados por OpenAI y sobre lo que sucede cuando los resultados de la investigación no son favorables para la empresa o contradicen decisiones que ya tomó internamente.
Esa tensión entre financiamiento e independencia no es exclusiva de OpenAI — es un desafío estructural que todo el campo de investigación en tecnología enfrenta desde hace décadas. Pero adquiere matices especialmente relevantes cuando hablamos de seguridad en inteligencia artificial, un campo donde los riesgos son potencialmente enormes y donde la credibilidad de los hallazgos científicos puede tener implicaciones directas en políticas públicas, regulaciones y en las decisiones que miles de millones de usuarios toman todos los días al interactuar con sistemas de IA.
La independencia metodológica y editorial de los investigadores participantes del Safety Fellowship será, por lo tanto, uno de los aspectos más observados a medida que el programa avance. La primera promoción de becarios tendrá sus resultados publicados a principios de 2027, y es a partir de esas entregas — papers, benchmarks y datasets — que el mercado y la comunidad científica podrán evaluar si el programa generó investigación genuinamente independiente o si funcionó más como un sello de legitimidad para la empresa. 🔍
Qué esperar de aquí en adelante
Con el cierre de inscripciones marcado para el 3 de mayo y la notificación de los seleccionados prevista para el 25 de julio, los próximos meses van a revelar mucho sobre el perfil de los investigadores que OpenAI pretende atraer y sobre el nivel de autonomía que tendrán en la práctica. La diversidad de áreas aceptadas — desde ciberseguridad hasta ciencias sociales e interacción humano-computadora — sugiere que la empresa quiere ampliar la conversación sobre seguridad en IA más allá de los círculos tradicionales de machine learning, lo cual es positivo.
Al final del día, el OpenAI Safety Fellowship es un programa que merece ser seguido de cerca, tanto por lo que promete como por las preguntas que plantea. La investigación independiente sobre riesgos de inteligencia artificial es necesaria, urgente y tiene potencial real de marcar una diferencia. Lo que aún queda por demostrar es si OpenAI está dispuesta a sostener ese compromiso más allá del anuncio — en las decisiones difíciles que ningún comunicado oficial va a cubrir, pero que van a definir, en la práctica, lo que la empresa realmente piensa sobre ética y seguridad en IA. Si los fellows que reciban estas becas lograrán de hecho influir en el desarrollo de los modelos aun sin acceso interno es la pregunta que la primera promoción empezará a responder a principios de 2027. 🚀
