Los investigadores desarrollan un método novedoso para filtrar datos WGS sin procesar disponibles públicamente de SARS-CoV-2

En un estudio reciente publicado en el bioRxiv* servidor de preimpresión, los investigadores desarrollaron un método novedoso para examinar datos de secuenciación del genoma completo (WGS) sin procesar disponibles públicamente del síndrome respiratorio agudo severo coronavirus 2 (SARS-CoV-2) e identificar mutaciones de interés más rápidamente.

Estudiar: El método de identificación intrahost SARS-CoV-2 k-mer (iSKIM) para la detección rápida de mutaciones preocupantes revela la aparición de patrones de mutación globales. Crédito de la imagen: Tartila/Shutterstock

Fondo

La revisión actual utilizó un método de identificación intrahost SARS-CoV-2 k-mer (iSKIM), que tenía ‘k-mers’ para las variantes de preocupación (VOC) y variantes de interés (VOI) del SARS-CoV-2. El SARS-CoV-2 a menudo exhibe variaciones dentro de un huésped y vive y se transmite como una población de variantes, denominadas variantes menores dentro del huésped.

La evaluación de la dinámica intrahuésped en varios millones de muestras de genoma sin procesar sigue siendo un desafío computacional. En este contexto, contar secuencias genómicas relativamente cortas de longitud k, o ‘k-mers’, ha demostrado ser un enfoque bioinformático eficiente para múltiples conjuntos de datos de secuenciación de alto rendimiento. Ayuda a evitar la alineación y los pasos de posprocesamiento que consumen mucho tiempo y que están relacionados con los métodos de ensamblaje del genoma basados ​​en referencias más tradicionales.

Sobre el estudio

En el presente estudio, los investigadores recuperaron los conjuntos de datos del archivo de lectura de secuencias (SRA, por sus siglas en inglés) del Centro Nacional de Información Biotecnológica (NCBI, por sus siglas en inglés) que contenían VOC/VOI del SARS-CoV-2 que definen mutaciones presentadas como variantes menores intrahost para realizar un análisis intrahost a una escala mucho mayor.

El método iSKIM escaneó rápidamente las lecturas de secuenciación de SARS-CoV-2 sin procesar en la base de datos de SRA que contenían mutaciones de SARS-CoV-2 VOC/VOI entre febrero de 2020 y abril de 2021, es decir, el período que abarca desde el comienzo de la pandemia hasta la aparición de la variante delta. En total, los investigadores examinaron 108 mutaciones específicas del linaje del SARS-CoV-2.

El conjunto de datos SRA carece de suficientes metadatos y detalles de los conjuntos de cebadores específicos utilizados para cada ejecución. Por lo tanto, los autores utilizaron los protocolos ARTIC durante los análisis del estudio. Los populares conjuntos de cebadores ARTIC se actualizan regularmente y excluyen secuencias de cebadores de la presentación de secuencias. El equipo también realizó una comparación de iSKIM con LoFreq y ngs_mapper, ambos métodos establecidos basados ​​en el ensamblaje del genoma de referencia, para confirmar la precisión de sus resultados.

Hallazgos del estudio

Los autores observaron que 15 de 108 mutaciones mostraron un marcado aumento como variantes intrahuésped menores en muestras recolectadas de uno a cinco meses antes de la fijación. Según los resultados del estudio, aparecieron mutaciones específicas en la población como variantes menores unos meses antes de que estas mutaciones aparecieran como mutaciones fijas en la mayoría de las muestras del estudio.

De las 15 mutaciones identificadas con este patrón, 10 estadísticamente significativas han anidado dentro de la proteína espiga (S). Sin embargo, 17 mutaciones no mostraron un aumento sustancial en la presencia de variantes menores a pesar de un aumento en las muestras que poseían estas mutaciones como variantes fijas.

Además, los autores observaron que 11 de las otras mutaciones estadísticamente significativas estaban anidadas dentro de las proteínas no estructurales del SARS-CoV-2. Quizás muchas de estas mutaciones no proporcionaron una ventaja de aptitud para el SARS-CoV-2 y fueron mutaciones neutrales que surgieron junto con mutaciones beneficiosas que luego se arreglaron.

El iSKIM llamó constantemente a la mutación S L452R con una frecuencia ligeramente más alta en las 68 muestras de septiembre de 2020, mientras que LoFreq no identificó esta mutación intrahuésped menor de las variantes del SARS-CoV-2. Además, los resultados intrahost variantes menores de la mutación Spike N501Y en las 834 muestras de octubre de 2020 fueron comparables en los tres métodos. Además, la mayoría de estas muestras pertenecían al linaje Alfa (B.1.177), mientras que otras pertenecían a los linajes B.1.36.28, B.1.36.17 y B.1.221.1/B.1.221.2.

Cada uno de estos linajes estuvo involucrado en múltiples eventos de recombinación que ocurrieron durante el surgimiento de Alpha VoC; sin embargo, ninguno de los recombinantes contenía un complemento completo de las mutaciones Alfa.

Conclusiones

El iSKIM evaluó rápidamente muestras recién secuenciadas que contenían COV del SARS-CoV-2 u otras mutaciones de interés del VOI. Por lo tanto, permitió a los investigadores priorizar un conjunto específico de muestras de genoma para el ensamblaje del genoma basado en referencias y el análisis posterior, lo que permitió la generación de informes oportunos cuando el tiempo de respuesta era crítico. Además, los resultados de iSKIM proporcionaron una vista complementaria de los datos genómicos del SARS-CoV-2 junto con los resultados típicos del genoma de consenso.

Los estudios han identificado mutaciones raras de SARS-CoV-2 en secuencias genómicas muestreadas de vigilancia de aguas residuales o reservorios de animales, siendo este último una fuente de variantes de SARS-CoV-2 que podrían volver a los humanos. El enfoque iSKIM podría ayudar con la detección temprana y la curación de mutaciones tan raras y la creciente lista de mutaciones del SARS-CoV-2 que no se han visto en ninguno de los VOC anteriores del SARS-CoV-2 (p. ej., mutaciones que surgen en pacientes con diversas formas de inmunosupresión). De hecho, este método novedoso se mostró prometedor en comparación con el paradigma actual para la detección temprana de variantes menores intrahuésped del SARS-CoV-2.

*Noticia importante

bioRxiv publica informes científicos preliminares que no son revisados ​​por pares y, por lo tanto, no deben considerarse concluyentes, guiar la práctica clínica o el comportamiento relacionado con la salud ni tratarse como información establecida.

Leave a Reply

Your email address will not be published.

This site uses Akismet to reduce spam. Learn how your comment data is processed.