Para compartir:

Herramientas de diseño de proteínas con IA para biólogos de todo el mundo

La inteligencia artificial ya demostró que puede acelerar el desarrollo de fármacos y profundizar el entendimiento de varias enfermedades. Pero para que esa revolución salga del papel y se convierta en terapia real, es esencial poner los modelos más avanzados directamente en manos de quienes están en el laboratorio: los científicos de bancada, y no solo los especialistas en machine learning.

Es justamente ahí donde entra OpenProtein.AI, una empresa que creó una plataforma no-code para diseño de proteínas guiado por IA. La propuesta es permitir que biólogos e investigadores usen potentes modelos base para diseñar proteínas, predecir estructura y función e incluso entrenar sus propios modelos, sin necesidad de escribir una sola línea de código ni montar una infraestructura pesada de cómputo.

La compañía fue fundada por Tristan Bepler, PhD por el MIT en 2020, y por Tim Lu, exprofesor asociado del MIT y PhD por la misma institución en 2007. Hoy, la plataforma de OpenProtein.AI ya es utilizada por equipos de farmacéuticas y biotechs de varios tamaños, además de estar disponible gratuitamente para científicos del mundo académico, lo que ayuda a reducir la distancia entre la investigación de punta y quienes realmente están explorando nuevos blancos terapéuticos.

Según Bepler, el momento es especialmente emocionante porque estos modelos no solo vuelven la ingeniería de proteínas más eficiente, acortando ciclos de desarrollo para terapias y aplicaciones industriales, sino que también amplían la capacidad de crear proteínas inéditas, con características específicas diseñadas a medida. La visión a largo plazo va más allá de las proteínas: la empresa ya piensa en aplicar enfoques similares a otros tipos de moléculas, construyendo una especie de lenguaje formal para describir sistemas biológicos complejos.

Del MIT a OpenProtein.AI: cómo la IA se volvió un lenguaje para proteínas

La historia de OpenProtein.AI comienza en 2014, cuando Tristan Bepler entra al programa de doctorado en Computational and Systems Biology del MIT, bajo la dirección de Bonnie Berger, una de las referencias en matemática aplicada a la biología. Fue ahí donde se dio cuenta de una limitación seria: todavía entendemos demasiado poco sobre las moléculas que forman la base de la vida como para construir buenos modelos predictivos sobre ellas.

En la práctica, eso significaba que todavía era difícil predecir, con seguridad, cómo se iba a comportar un circuito genómico completo o cómo reaccionaría una red de interacción de proteínas ante cambios. Esta brecha despertó en Bepler el interés por estudiar proteínas a un nivel mucho más fino, conectando secuencia, estructura y función con el apoyo de la IA.

Durante el doctorado, comenzó a usar datos evolutivos para intentar predecir cadenas de aminoácidos que forman proteínas, antes incluso del surgimiento de AlphaFold, el modelo de Google DeepMind que hoy es referencia en predicción de estructura de proteínas. Ese trabajo llevó a uno de los primeros modelos generativos enfocados en entender y diseñar proteínas. El equipo pasó a llamar a este tipo de sistema modelo de lenguaje de proteínas, porque trata las secuencias de aminoácidos de forma parecida a como un modelo de lenguaje trabaja con texto.

El gran desafío que guiaba el proyecto era sencillo de formular, pero nada trivial de resolver: si sabemos que la función de la proteína depende de su secuencia y estructura, ¿sería posible usar modelos base para saltarse la etapa explícita de estructura e ir directo de secuencia a función? Esta línea de investigación allanó el camino para OpenProtein.AI.

Reciba el mejor contenido sobre innovación en su correo electrónico.

Todas las noticias, consejos, tendencias y recursos que buscas, directamente en tu bandeja de entrada.

Al suscribirte al boletín informativo, aceptas recibir comunicaciones de Método Viral. Nos comprometemos a proteger y respetar siempre tu privacidad.

Después de defender el doctorado en 2020, Bepler se incorporó como posdoctorando al laboratorio de Tim Lu, en el Departamento de Ingeniería Biológica del MIT. En esa época, la idea de integrar IA y biología empezaba a ganar fuerza de verdad. En el grupo de Lu, Bepler ayudó a desarrollar mejores modelos computacionales para el diseño de biológicos, mostrando en la práctica que existía un desajuste: los modelos más avanzados estaban disponibles, pero muchos biólogos no conseguían usarlos porque no sabían programar o no tenían acceso a infraestructura de GPU.

De ahí nace el concepto central de OpenProtein.AI: crear una plataforma que acerca los modelos de IA a los biólogos, en vez de obligar a los biólogos a convertirse en expertos en IA.

Plataforma no-code para ingeniería de proteínas con IA

OpenProtein.AI fue pensada desde el inicio como un entorno de machine learning in-the-loop para ingeniería de proteínas. En lugar de un paquete de scripts y bibliotecas sueltas, la empresa desarrolló una plataforma completa, con una interfaz web intuitiva, que permite:

  • Subir datos de secuencias, mediciones experimentales y bibliotecas de variantes;
  • Entrenar modelos específicos usando datos del propio laboratorio del usuario;
  • Generar nuevas secuencias de proteínas a gran escala, in silico;
  • Predecir estructura y función con base en modelos de lenguaje de proteínas y modelos estructurales;
  • Analizar comparativamente variantes para priorizar cuáles deben ir a validación en laboratorio.

El usuario no interactúa con líneas de comando, clústeres o scripts complejos. En lugar de eso, trabaja con flujos guiados, parámetros claros y resultados visualizados de forma amigable. Para quien prefiere código, la empresa también ofrece APIs para integración directa con pipelines personalizados, pero esa parte es opcional.

Una de las piezas centrales de la plataforma es PoET (Protein Evolutionary Transformer), el modelo de lenguaje de proteínas desarrollado internamente por OpenProtein.AI. PoET fue entrenado en grupos de proteínas relacionadas evolutivamente, lo que le permite al modelo:

  • Capturar restricciones evolutivas importantes para la estabilidad y la función;
  • Generar conjuntos de proteínas emparentadas, no solo variaciones aleatorias;
  • Incorporar nuevos datos experimentales sin necesidad de ser totalmente reentrenado, actualizando su entendimiento a partir de resultados de laboratorio.

En la práctica, esto significa que los investigadores pueden usar sus propios datos para refinar el modelo, optimizar secuencias para una función determinada y, luego, usar las demás herramientas de la plataforma para profundizar el análisis. Es común ver grupos generando bibliotecas enteras de secuencias de forma virtual, pasando todo por predictores de función y estructura, y solo después seleccionar un subconjunto reducido de candidatos para pruebas experimentales.

Este ciclo reduce costos, tiempo y también frustración, porque el laboratorio pasa a gastar recursos principalmente en candidatos más prometedores. Además, es posible partir de una proteína de interés y pedirle al modelo que genere nuevas variantes con propiedades similares o mejoradas, lo que ayuda tanto en proyectos terapéuticos como en aplicaciones industriales.

Una caja de herramientas abierta para diferentes tipos de proteína

Un aspecto que el equipo de OpenProtein.AI hace cuestión de destacar es que su plataforma fue construida como un conjunto de herramientas abiertas y flexibles, y no como un pipeline rígido para un único tipo de proteína o función. La idea es dar soporte desde enzimas industriales hasta anticuerpos terapéuticos, pasando por proteínas de señalización y otras clases.

Los modelos de la empresa se entrenan para entender proteínas de forma amplia, es decir, aprenden sobre el espacio completo de secuencias posibles, no solo sobre familias muy específicas. Esto permite un flujo de trabajo más exploratorio, en el que el usuario puede probar hipótesis más arriesgadas, intentar combinaciones inusuales de dominios o abordar blancos aún poco estudiados.

Al mismo tiempo, este enfoque abierto no excluye casos de uso muy dirigidos. Los laboratorios pueden configurar flujos enfocados en:

  • Aumentar la estabilidad térmica o en pH extremo;
  • Reducir inmunogenicidad en aplicaciones humanas;
  • Mejorar la afinidad por un receptor específico;
  • Crear proteínas con funciones múltiples, como moléculas que cambian de comportamiento después de unirse a un blanco.

Esta flexibilidad es importante porque la frontera de la biotecnología está migrando justamente hacia terapias más complejas, lógicas de proteína más sofisticadas y sistemas dinámicos que responden de forma condicionada al entorno celular.

Alianzas en la industria farmacéutica y avances de PoET-2

El impacto de la plataforma no se quedó restringido al mundo académico. En 2025, la gran farmacéutica Boehringer Ingelheim comenzó a usar las herramientas de OpenProtein.AI en sus proyectos internos. La alianza evolucionó hasta el punto de que las dos empresas anunciaron una colaboración ampliada, en la que la plataforma y los modelos de OpenProtein.AI pasan a estar integrados directamente en los flujos de trabajo de Boehringer para ingeniería de proteínas enfocadas en enfermedades como cáncer, condiciones autoinmunes e inflamatorias.

Este movimiento muestra cómo la industria está adoptando, de hecho, modelos de IA de última generación para rediseñar sus procesos de descubrimiento y optimización de biológicos.

Además, OpenProtein.AI lanzó recientemente una nueva generación de su modelo, PoET-2. Esta versión consigue superar modelos mucho más grandes usando solo una fracción de los recursos computacionales y de los datos experimentales necesarios para entrenar. En otras palabras, PoET-2 fue diseñado para ser más eficiente y accesible, algo crucial en un escenario en el que el costo de entrenar grandes modelos de IA crece rápido.

Entre las preguntas que guían el desarrollo de PoET-2, están algunas muy fundamentales para quienes trabajan con proteínas:

Herramientas que usamos a diario

  • ¿Cómo describir con precisión las restricciones que definen una proteína funcional?
  • ¿Qué lenguaje específico podemos usar para representar estas limitaciones estructurales y funcionales?
  • ¿Cómo incorporar aún más información evolutiva en el proceso de generación de secuencias?
  • ¿Cómo representar reacciones enzimáticas de forma que un modelo consiga crear secuencias capaces de realizar exactamente esas reacciones?

Estas cuestiones apuntan a un objetivo claro: construir un lenguaje formal para proteínas, lo bastante rico como para orientar modelos de IA en la creación de secuencias que no solo parezcan plausibles, sino que realicen funciones bioquímicas útiles en el mundo real.

El próximo paso: proteínas dinámicas y múltiples mecanismos

El foco actual de muchos grupos de investigación, incluidos los vinculados a OpenProtein.AI, está en ir más allá de la simple predicción de eventos de unión o funciones estáticas. La visión de futuro es usar estos modelos para diseñar proteínas dinámicas, capaces de:

  • Interactuar con dos, tres o más mecanismos biológicos al mismo tiempo;
  • Cambiar de función después de unirse a un determinado blanco;
  • Actuar como componentes de lógica molecular, respondiendo de manera condicional a señales del entorno celular.

Tim Lu, que hoy actúa como asesor de la empresa, destaca que esta transición exige modelos que consideren no solo el estado estático de una proteína, sino cómo se comporta a lo largo del tiempo, en diferentes contextos celulares y en redes de interacción complejas. Esto amplía bastante el desafío computacional, pero también abre la puerta a terapias más inteligentes y personalizadas.

La importancia del acceso abierto en IA aplicada a la biología

A medida que los modelos de IA se vuelven más grandes, más sofisticados y más caros de entrenar, también crece el riesgo de que se conviertan en recursos concentrados en manos de unos pocos actores con gran poder financiero. Para el campo científico, eso sería un problema serio: buena parte de los descubrimientos en biología todavía nace en universidades, laboratorios públicos y grupos de investigación más pequeños.

Por eso, OpenProtein.AI refuerza la importancia de mantener un ecosistema abierto en IA y biología, en el que al menos una parte significativa de las herramientas, modelos e infraestructuras quede accesible para la comunidad científica más amplia. La oferta de la plataforma sin costo para investigadores académicos sigue exactamente esa línea.

A medida que los proyectos crecen en complejidad, incorporando lógica de proteínas, terapias dinámicas y sistemas que responden a múltiples señales de forma coordinada, los conjuntos experimentales tradicionales comienzan a mostrar sus límites. Contar con modelos robustos, bien entrenados y accesibles ayuda a compensar esas restricciones y permite que más grupos contribuyan con datos, hipótesis y validaciones.

Al integrar IA, ingeniería de proteínas y herramientas de uso sencillo, OpenProtein.AI ilustra bien un camino posible para el futuro de la biología computacional: en lugar de separar a quienes programan de quienes pipetean, unir ambos mundos en una plataforma que se lleve bien con los dos, acelerando la llegada de la próxima generación de terapias y aplicaciones biotecnológicas.

Imagen de Rafael

Rafael

Operaciones

Transformo los procesos internos en máquinas de entrega, garantizando que cada cliente de Viral Method reciba un servicio de primera calidad y resultados reales.

Rellena el formulario y nuestro equipo se pondrá en contacto contigo en un plazo de 24 horas.

Publicaciones relacionadas

Las acciones de Amazon podrían subir tras la asociación con OpenAI.

Alianza entre Amazon y OpenAI podría impulsar ingresos de IA y valorizar acciones, dice Citi; impacto estratégico en AWS y

Moratoria sobre los centros de datos de IA: El debate sobre la energía

Moratoria: Sanders y AOC proponen pausa en construcción de centros de datos de IA en EE.UU. para evaluar impactos ambientales

Blockchain y los agentes de IA están cambiando los pagos con criptomonedas.

Agentes de IA impulsan pagos cripto con blockchain, stablecoins y x402, facilitando transacciones autónomas, micropagos y economía entre máquinas

Receba o melhor conteúdo de inovação em seu e-mail

Todas as notícias, dicas, tendências e recursos que você procura entregues na sua caixa de entrada.

Ao assinar a newsletter, você concorda em receber comunicações da Método Viral. A gente se compromete a sempre proteger e respeitar sua privacidade.

Rafael

Online

Atendimento

Calculadora de Precio de Sitios

Descubre cuánto cuesta el sitio ideal para tu negocio

Páginas del Sitio

¿Cuántas páginas necesitas?

Arrastra para seleccionar de 1 a 20 páginas

En solo 2 minutos, descubre automáticamente cuánto cuesta un sitio a medida para tu negocio

Más de 0+ empresas ya calcularon su presupuesto

Fale com um consultor

Preencha o formulário e nossa equipe entrará em contato.