IA Evo 2: Nuevo modelo genético revoluciona la biología y la medicina

by Editor de Tecnologia
[Photo by garykbrixi (courtesy of Arc Institute)]

Científicos han desarrollado un modelo de inteligencia artificial capaz de leer, analizar y generar código genético en todos los dominios de la vida conocidos, un avance con vastas implicaciones para la comprensión de enfermedades humanas, el diseño de nuevos tratamientos y el progreso del conocimiento biológico a una escala previamente imposible.

El modelo, denominado Evo 2, fue publicado en la revista Nature el 4 de marzo por un equipo de investigadores del Arc Institute, una organización sin fines de lucro dedicada a la investigación biomédica con sede en Palo Alto, California. A diferencia de los modelos de IA comúnmente utilizados, como ChatGPT y Claude de Anthropic, que se basan en texto escrito en lenguajes humanos, Evo 2 fue entrenado enteramente con secuencias de ADN –aproximadamente 9 billones de pares de bases– extraídas de bacterias, plantas, animales y todos los demás dominios de la vida.

Patrick Hsu, cofundador e investigador principal del Arc Institute y coautor principal del estudio, declaró a phys.org:

Nuestro desarrollo de Evo 1 y Evo 2 representa un momento clave en el campo emergente de la biología generativa, ya que los modelos han permitido a las máquinas leer, escribir y pensar en el lenguaje de los nucleótidos.

Las posibles aplicaciones de un modelo como este son revolucionarias. Una herramienta que pueda predecir qué variaciones genéticas causan enfermedades, generar nuevas secuencias de ADN plausibles e identificar las propiedades funcionales de los genes en toda la biología podría acelerar drásticamente el desarrollo de nuevos medicamentos, terapias génicas y herramientas de diagnóstico. Podría transformar la comprensión y el tratamiento del cáncer, los trastornos genéticos, las enfermedades autoinmunes y las enfermedades infecciosas. En condiciones de organización social racional y científicamente planificada, estas capacidades podrían estar disponibles para toda la humanidad.

Sin embargo, bajo el capitalismo, los beneficios de tales avances inevitablemente se canalizan hacia las ganancias. Los gigantes farmacéuticos y las empresas de biotecnología que ya están desarrollando aplicaciones basadas en modelos de IA biológica de código abierto patentarán los tratamientos derivados y fijarán sus precios para maximizar el retorno de la inversión para los accionistas, no para mejorar la salud pública. La clase trabajadora, que produce la riqueza social que hace posible esta investigación, se verá en gran medida privada del acceso a los tratamientos que salvan vidas que de ella emergen.

Construyendo el modelo

Para construir Evo 2, los científicos recopilaron secuencias de ADN de casi 10 bases de datos de genomas públicas en un conjunto de datos masivo único llamado OpenGenome2. Con 5,5 terabytes –superando con creces la capacidad de almacenamiento de un ordenador portátil o estación de trabajo típico–, el conjunto de datos refleja la enorme escala de la tarea. Estas secuencias fueron aportadas por cientos de científicos de todo el mundo y se pusieron a disposición del público de forma gratuita, un testimonio del carácter colaborativo y no propietario del trabajo científico que choca con los imperativos de la competencia capitalista.

Existen dos versiones principales del modelo: Evo 2 7B, con 7 mil millones de parámetros entrenados en 2,3 billones de pares de bases, y Evo 2 40B, con 40 mil millones de parámetros entrenados en el conjunto de datos completo. El modelo más grande es más potente, pero requiere sustancialmente más recursos computacionales.

leer más  Conversor YouTube: Descarga y Convierte Videos

La creación de Evo 2 fue posible gracias a StripedHyena 2, una nueva arquitectura computacional que permitió el entrenamiento con 30 veces más datos que su predecesor, Evo 1, al tiempo que procesaba secuencias de hasta 1 millón de nucleótidos a la vez, muy superior a cualquier modelo de IA biológica anterior.

Después de construir el modelo, los científicos evaluaron su capacidad para realizar una variedad de tareas: predecir los efectos de las mutaciones genéticas, identificar variaciones causantes de enfermedades en el ADN humano, detectar propiedades funcionales de diferentes regiones del genoma y generar secuencias de ADN completamente nuevas.

You may also like

Leave a Comment

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.