xVERSE: El nuevo modelo de inteligencia artificial que crea «células virtuales»
En el mundo de la ciencia y la tecnología, ha surgido una herramienta disruptiva que promete cambiar la forma en que entendemos la biología. Se trata de xVERSE, un modelo fundacional nativo de transcriptómica desarrollado por Xiaohui Jiang y Jichun Xie de la Universidad de Duke, diseñado para la representación universal de células y la síntesis de células virtuales.

A diferencia de otros modelos basados en arquitecturas de lenguaje que suelen ignorar las distribuciones de datos transcriptómicos, xVERSE combina el aprendizaje de representaciones invariantes al lote con la generación probabilística de perfiles de expresión. Este enfoque permite que el modelo supere a los métodos especializados y a otros modelos fundacionales en el aprendizaje de representaciones, logrando una mejora del 17.9% y 11.4% respectivamente, manteniendo la heterogeneidad biológica mientras reduce los efectos de lote.
Capacidades que transforman la investigación
El potencial de xVERSE se extiende a diversas aplicaciones avanzadas en transcriptómica de célula única y espacial:
- Síntesis de células virtuales: El modelo puede generar células virtuales de alta fidelidad que son indistinguibles de los datos biológicos reales (con un AUROC ≈ 0.5).
- Aumento de datos: Gracias a estas células sintéticas, xVERSE actúa como un motor de aumento de datos que permite la detección de marcadores y la agrupación precisa en conjuntos de datos muy pequeños, logrando resolver tipos de células raras con tan solo cuatro células.
- Imputación espacial: Supera al segundo mejor método de imputación espacial por un 34.3%, imputando genes no medidos en datos de transcriptómica espacial utilizando referencias de célula única.
- Representación universal: Permite extraer embeddings biológicos (z_bio) robustos frente al ruido y los efectos de lote.
Este marco de trabajo no solo mejora la generalizabilidad de las predicciones entre diversas modalidades en estados patológicos, sino que se posiciona como una herramienta transformadora que desbloquea capacidades analíticas que superan a los modelos convencionales.
