Para compartir:

Inteligencia artificial y biología: cómo OpenProtein.AI está poniendo herramientas de diseño de proteínas en manos de científicos de todo el mundo

La inteligencia artificial ya demostró que puede acelerar el desarrollo de medicamentos y profundizar nuestra comprensión sobre enfermedades. Pero hay un problema del que pocos hablan abiertamente: los modelos más poderosos que existen hoy están, en la práctica, fuera del alcance de la mayoría de los científicos.

No por falta de interés, sino porque la mayor parte de los biólogos simplemente no tiene formación en machine learning. Y ahí reside una paradoja curiosa: la tecnología avanza a una velocidad absurda, pero quienes más podrían beneficiarse de ella se quedan en la puerta, sin poder entrar.

Es exactamente esa brecha entre el diseño de proteínas y la computación avanzada la que OpenProtein.AI decidió cerrar. La empresa fue fundada por Tristan Bepler, quien completó su doctorado en el MIT en 2020, y por Tim Lu, exprofesor asociado del MIT con doctorado finalizado en 2007. Juntos construyeron una plataforma que funciona como un puente entre dos mundos que rara vez se comunican bien: el universo técnico del machine learning y el día a día de los laboratorios de biología.

Y lo que hace esta historia aún más interesante es que no nació de una gran corporación intentando monetizar una tendencia. Nació de una percepción simple pero poderosa: el problema no era solo técnico, era de acceso.

Qué es OpenProtein.AI y por qué importa ahora

La OpenProtein.AI es una plataforma de biología computacional no-code que pone herramientas de inteligencia artificial directamente en manos de investigadores que trabajan con proteínas. No les exige dominar lenguajes de programación ni arquitecturas de redes neuronales para ello. En lugar de obligar al científico a aprender machine learning desde cero, la plataforma ofrece una interfaz web intuitiva donde es posible subir datos, entrenar modelos, ajustar parámetros y aplicar modelos predictivos basados en los propios datos experimentales de cada laboratorio. Para quienes prefieren integrar mediante código, la plataforma también ofrece APIs. Esto cambia completamente la dinámica de quién puede usar estas tecnologías y para qué.

El momento de esta iniciativa no podría ser más relevante. Vivimos una época en la que el diseño de proteínas dejó de ser una curiosidad académica y se convirtió en una de las fronteras más candentes de la ciencia aplicada. Las proteínas son las máquinas moleculares que ejecutan prácticamente todo dentro de las células, y conseguir diseñarlas con precisión abre puertas enormes: desde el desarrollo de nuevos biofármacos hasta la creación de enzimas industriales más eficientes e incluso soluciones para problemas ambientales. La cuestión es que este proceso siempre fue lento, caro y altamente dependiente del ensayo y error. La inteligencia artificial tiene el potencial de recortar drásticamente ese ciclo, pero solo si está accesible para quienes realmente conocen la biología detrás del problema.

Como el propio Bepler expresó, este es un momento emocionante porque estos modelos no solo hacen más eficiente la ingeniería de proteínas, acortando ciclos de desarrollo de terapéuticos y aplicaciones industriales, sino que también amplían la capacidad de diseñar nuevas proteínas con características específicas. La visión más amplia de la empresa va más allá: están creando un lenguaje para describir sistemas biológicos y ya piensan en aplicar estos enfoques a modalidades que van más allá de las proteínas.

Por eso la propuesta de OpenProtein.AI resuena tan fuerte dentro de la comunidad científica. No intenta reemplazar al científico ni simplificar demasiado la ciencia. Ofrece un entorno donde el conocimiento biológico del investigador se combina con el poder computacional de los modelos predictivos modernos, generando algo que ninguno de los dos lados conseguiría alcanzar por separado. La empresa también ofrece acceso gratuito a la plataforma para científicos del ámbito académico, reforzando que el compromiso con la accesibilidad es real y no meramente retórico.

La trayectoria académica que llevó a la creación de la plataforma

La historia de OpenProtein.AI comienza en los pasillos del MIT. Bepler llegó a la universidad en 2014 como parte del programa de doctorado en Biología Computacional y de Sistemas, estudiando bajo la dirección de Bonnie Berger, profesora Simons de Matemáticas Aplicadas del MIT. Fue durante esa experiencia que se dio cuenta de cuánto aún no entendemos sobre las moléculas que forman los bloques fundamentales de la biología.

Reciba el mejor contenido sobre innovación en su correo electrónico.

Todas las noticias, consejos, tendencias y recursos que buscas, directamente en tu bandeja de entrada.

Al suscribirte al boletín informativo, aceptas recibir comunicaciones de Método Viral. Nos comprometemos a proteger y respetar siempre tu privacidad.

Según Bepler, en aquel entonces todavía no habíamos caracterizado biomoléculas y proteínas de forma suficiente como para crear buenos modelos predictivos sobre el comportamiento de, por ejemplo, un circuito genómico completo o una red de interacción proteica. Esta constatación lo llevó a investigar proteínas a un nivel mucho más detallado.

Comenzó a explorar formas de predecir las cadenas de aminoácidos que componen proteínas, analizando datos evolutivos. Esto ocurrió antes de que Google lanzara AlphaFold, el potente modelo de predicción de estructura proteica. Ese trabajo resultó en uno de los primeros modelos generativos de inteligencia artificial para comprensión y diseño de proteínas, lo que el equipo denomina modelo de lenguaje de proteínas.

Lo que particularmente entusiasmaba a Bepler era el marco clásico de las proteínas y las relaciones entre secuencia, estructura y función. Estas conexiones aún no se comprenden bien, y él quería descubrir cómo usar foundation models para saltar el componente de estructura e ir directamente de la secuencia a la función. Esa pregunta aparentemente simple cargaba una ambición enorme y acabó moldeando el camino de toda la empresa.

Tras completar el doctorado en 2020, Bepler ingresó al laboratorio de Tim Lu en el Departamento de Ingeniería Biológica del MIT como posdoctoral. Lu recuerda que aquella era la época en que la idea de integrar IA con biología empezaba a ganar tracción. Bepler los ayudó a construir mejores modelos computacionales para el diseño de biológicos, y juntos percibieron una desconexión real: las herramientas más avanzadas existían, pero los biólogos que encantados las habrían usado no sabían programar. OpenProtein.AI nació directamente de la idea de ampliar el acceso a esas herramientas.

Cómo los modelos predictivos están transformando el diseño de proteínas

Durante décadas, entender cómo una proteína se pliega en el espacio tridimensional fue considerado uno de los mayores desafíos de la biología. El problema era tan complejo que recibió el nombre de problema del plegamiento de proteínas, y resistió décadas de intentos usando métodos tradicionales. Cuando AlphaFold presentó resultados extraordinarios en la predicción de estructuras proteicas, el mundo científico quedó atónito con lo que la inteligencia artificial era capaz de hacer. Pero predecir estructuras es solo una parte del desafío. El siguiente paso, que es diseñar proteínas completamente nuevas con funciones específicas, exige un nivel aún más sofisticado de modelos predictivos, y es exactamente aquí donde plataformas como OpenProtein.AI entran con toda la fuerza.

Los modelos predictivos usados en el diseño de proteínas funcionan, de manera simplificada, aprendiendo patrones en enormes bases de datos de secuencias proteicas conocidas. A partir de esos patrones, pueden sugerir qué combinaciones de aminoácidos tienen mayor probabilidad de producir una proteína con determinada característica, ya sea estabilidad térmica, capacidad de unirse a un objetivo específico o resistencia a determinados ambientes químicos.

Lo que OpenProtein.AI hace de diferente es permitir que los investigadores alimenten esos modelos con sus propios datos experimentales, haciendo las predicciones mucho más relevantes para el contexto específico de cada estudio. En lugar de depender solo de datos públicos genéricos, el científico puede construir un modelo ajustado a la realidad de su laboratorio.

PoET: el modelo de lenguaje de proteínas que cambia las reglas del juego

Uno de los puntos destacados de la plataforma es PoET, sigla de Protein Evolutionary Transformer. Este es el modelo de lenguaje de proteínas principal de OpenProtein.AI, y fue entrenado en grupos de proteínas para generar conjuntos de proteínas relacionadas entre sí. Bepler y sus colaboradores demostraron que PoET consigue generalizar sobre restricciones evolutivas en proteínas e incorporar nueva información sobre secuencias proteicas sin necesidad de reentrenamiento completo. Esto significa que otros investigadores pueden agregar sus propios datos experimentales para mejorar el modelo, haciéndolo cada vez más preciso para sus casos de uso específicos.

En la práctica, los investigadores pueden usar sus datos para entrenar modelos y optimizar secuencias proteicas, y después utilizar otras herramientas de la plataforma para analizar esas proteínas. Es posible generar bibliotecas enteras de secuencias proteicas in silico, es decir, en el computador, y luego pasar esas secuencias por modelos predictivos para obtener validación y predicciones estructurales. Todo esto funciona como un front-end sin necesidad de código, aunque las APIs están disponibles para quienes prefieren acceder mediante programación.

Los modelos ayudan a los investigadores a diseñar proteínas más rápidamente y después decidir cuáles son lo suficientemente prometedoras para pruebas adicionales en el laboratorio. También es posible introducir proteínas de interés y dejar que los modelos generen nuevas proteínas con propiedades similares. Esto transforma fundamentalmente el ciclo de experimentación, reduciendo la cantidad de intentos a ciegas y dirigiendo recursos hacia los candidatos con mayor probabilidad de éxito.

En 2024, OpenProtein.AI lanzó una nueva versión del modelo, PoET-2, que supera a modelos mucho más grandes en rendimiento mientras utiliza solo una fracción de los recursos computacionales y datos experimentales. Este tipo de eficiencia es particularmente importante porque no todo laboratorio o empresa tiene acceso a supercomputadoras o presupuestos ilimitados para procesamiento en la nube.

Biología computacional accesible: el impacto real en los laboratorios

Cuando se habla de democratizar la biología computacional, es fácil que el discurso suene a marketing vacío. Pero cuando miramos lo que realmente sucede en los laboratorios de investigación alrededor del mundo, la situación es bastante concreta y bastante frustrante. Muchos grupos de investigación tienen datos ricos, preguntas científicas relevantes y capacidad experimental sólida, pero simplemente no pueden aprovechar los avances más recientes en inteligencia artificial porque no existe infraestructura de machine learning disponible para ellos.

Contratar a un especialista en ciencia de datos con conocimiento en biología computacional es caro y difícil, y las herramientas abiertas disponibles exigen un nivel de experiencia técnica que la mayoría de los biólogos no tiene y no debería necesitar tener solo para usar una herramienta de apoyo a la investigación.

OpenProtein.AI ataca este problema de frente, ofreciendo una experiencia diseñada pensando en el flujo de trabajo real de quienes trabajan con proteínas. Como explica Bepler, el equipo se esforzó mucho para convertir la plataforma en una caja de herramientas abierta, con flujos de trabajo específicos pero sin estar limitada a una función proteica o clase de proteínas en particular. Una de las grandes ventajas de estos modelos es que son muy buenos entendiendo proteínas de forma amplia, aprendiendo sobre todo el espacio de proteínas posibles.

El impacto práctico de esto se manifiesta en ciclos de descubrimiento más cortos y decisiones experimentales más informadas. En lugar de sintetizar y probar decenas de variantes proteicas a ciegas, un laboratorio que usa modelos predictivos puede priorizar los candidatos con mayor probabilidad de éxito, ahorrando tiempo, reactivos y dinero. En un escenario donde los recursos de investigación siempre son escasos, esa eficiencia no es solo conveniente, puede ser decisiva para que un proyecto avance o sea abandonado.

Las alianzas con la industria farmacéutica ya están en marcha

La relevancia de OpenProtein.AI no se limita al discurso. La gigante farmacéutica Boehringer Ingelheim comenzó a usar la plataforma a principios de 2025, y recientemente ambas empresas anunciaron una colaboración ampliada. La alianza prevé que la plataforma y los modelos de OpenProtein.AI se integren directamente al trabajo de Boehringer Ingelheim en ingeniería de proteínas para el tratamiento de enfermedades como el cáncer y condiciones autoinmunes o inflamatorias.

Este tipo de alianza señala algo importante: la industria farmacéutica, tradicionalmente conservadora en la adopción de nuevas tecnologías, está reconociendo que las herramientas de inteligencia artificial para diseño de proteínas ya no son experimentales. Son parte esencial del pipeline de desarrollo de nuevas terapias. Y cuando una empresa del tamaño de Boehringer Ingelheim apuesta en esta dirección, es un indicativo fuerte de que el mercado en su conjunto se está moviendo.

Herramientas que usamos a diario

Para empresas más pequeñas de biotech y para laboratorios académicos, la existencia de una plataforma como OpenProtein.AI nivela el campo de juego de una forma que habría sido impensable hace pocos años. Un grupo de investigación en una universidad latinoamericana, por ejemplo, puede acceder a los mismos foundation models que una multinacional farmacéutica europea está utilizando. Esa es la promesa concreta de la democratización tecnológica, y ya está sucediendo.

Lo que viene en el cruce entre IA y ciencia de las proteínas

El campo que une inteligencia artificial y diseño de proteínas todavía está en sus primeros capítulos, y la sensación entre quienes lo siguen de cerca es que el ritmo de evolución va a seguir sorprendiendo. La propia OpenProtein.AI ya está mirando hacia la próxima frontera. Bepler quiere resolver la cuestión de cómo describir proteínas de forma más completa: cuál es el lenguaje significativo y específico de dominio para las restricciones proteicas usadas durante la generación, cómo incorporar más restricciones evolutivas, cómo describir una reacción enzimática que una proteína realiza de tal forma que un modelo pueda generar secuencias para ejecutar esa reacción.

Tim Lu, que actualmente desempeña un papel consultivo en la empresa, señala un área que le entusiasma particularmente: ir más allá de eventos simples de unión proteica y usar estos modelos para predecir y diseñar características dinámicas, donde la proteína necesita activar dos, tres o cuatro mecanismos biológicos al mismo tiempo, o cambiar su función después de unirse a un objetivo. Este tipo de complejidad funcional es el siguiente gran desafío, y resolverlo podría abrir el camino hacia terapias verdaderamente programables.

Otro punto que merece atención es la tendencia de integración entre diferentes tipos de datos biológicos. Secuencias de aminoácidos, estructuras tridimensionales, datos de expresión génica, resultados de ensayos funcionales: todo esto se está incorporando gradualmente en enfoques de inteligencia artificial que consiguen razonar de forma multimodal, combinando diferentes fuentes de información para generar predicciones más robustas. OpenProtein.AI ya opera en esta dirección, y la expectativa es que plataformas como esta evolucionen para incorporar aún más capas de contexto biológico a lo largo del tiempo.

La importancia del acceso abierto para el avance científico

Lu hace una observación que merece ser destacada: a medida que el trabajo se vuelve más complejo, con enfoques que incorporan cosas como lógica proteica y terapias dinámicas, las herramientas experimentales existentes se vuelven limitantes. Enfatiza que es realmente importante crear ecosistemas abiertos en torno a IA y biología. Existe un riesgo real de que los recursos de inteligencia artificial queden tan concentrados que el investigador promedio no pueda usarlos. El acceso abierto es fundamental para que el campo científico siga progresando.

Esta advertencia no es trivial. A medida que los modelos de inteligencia artificial se vuelven más caros de entrenar y mantener, la tendencia natural del mercado es concentrar esas capacidades en pocas manos. Si eso ocurre en la intersección entre IA y biología, el resultado sería un escenario donde solo las grandes corporaciones podrían usar las herramientas más avanzadas, dejando atrás a la investigación académica y a las empresas más pequeñas. La decisión de OpenProtein.AI de ofrecer acceso gratuito para la academia es un contrapunto directo a esa tendencia, y señala una filosofía de que la ciencia avanza mejor cuando las herramientas se comparten.

En el fondo, lo que esta historia representa es algo más grande que una plataforma o una tecnología específica. Apunta hacia un futuro donde la distancia entre tener una hipótesis científica y poder probarla computacionalmente es mucho menor de lo que es hoy. Donde un investigador en cualquier parte del mundo, con datos relevantes y buenas preguntas, pueda usar inteligencia artificial de vanguardia sin necesitar un ejército de ingenieros a su lado. La biología computacional accesible no es solo una buena idea. Es, cada vez más, una necesidad real para que la ciencia avance a la velocidad que los desafíos de nuestro tiempo exigen. 🧬🤖

Imagen de Rafael

Rafael

Operaciones

Transformo los procesos internos en máquinas de entrega, garantizando que cada cliente de Viral Method reciba un servicio de primera calidad y resultados reales.

Rellena el formulario y nuestro equipo se pondrá en contacto contigo en un plazo de 24 horas.

Publicaciones relacionadas

Las acciones de Amazon podrían subir tras la asociación con OpenAI.

Alianza entre Amazon y OpenAI podría impulsar ingresos de IA y valorizar acciones, dice Citi; impacto estratégico en AWS y

Moratoria sobre los centros de datos de IA: El debate sobre la energía

Moratoria: Sanders y AOC proponen pausa en construcción de centros de datos de IA en EE.UU. para evaluar impactos ambientales

Blockchain y los agentes de IA están cambiando los pagos con criptomonedas.

Agentes de IA impulsan pagos cripto con blockchain, stablecoins y x402, facilitando transacciones autónomas, micropagos y economía entre máquinas

Receba o melhor conteúdo de inovação em seu e-mail

Todas as notícias, dicas, tendências e recursos que você procura entregues na sua caixa de entrada.

Ao assinar a newsletter, você concorda em receber comunicações da Método Viral. A gente se compromete a sempre proteger e respeitar sua privacidade.

Rafael

Online

Atendimento

Calculadora de Precio de Sitios

Descubre cuánto cuesta el sitio ideal para tu negocio

Páginas del Sitio

¿Cuántas páginas necesitas?

Arrastra para seleccionar de 1 a 20 páginas

En solo 2 minutos, descubre automáticamente cuánto cuesta un sitio a medida para tu negocio

Más de 0+ empresas ya calcularon su presupuesto

Fale com um consultor

Preencha o formulário e nossa equipe entrará em contato.