Investigadores de la Universidad de Drexel han creado un modelo informático que podría ayudar a predecir la gravedad de la próxima variante del coronavirus, gracias a que identifica correlaciones entre cambios en la secuencia genética del virus COVID-19 y aumentos en la transmisión, hospitalizaciones y muertes.

"La velocidad con la que las nuevas variantes, como Omicron, se han abierto camino en todo el mundo significa que para cuando los funcionarios de salud pública tengan una buena idea de cuán vulnerable podría ser su población, el virus ya ha llegado", han dicho los expertos.

El modelo Drexel, publicado en la revista ‘Computers in Biology and Medicine’, está impulsado por un análisis específico de la secuencia genética de la proteína de punta del virus, la parte del virus que le permite evadir el sistema inmunitario e infectar células sanas y que se sabe que ha mutado con mayor frecuencia durante la pandemia, junto a un análisis de aprendizaje automático de efectos mixtos de factores como la edad, el sexo y la ubicación geográfica de los pacientes.

Áreas que tienen más probabilidades de cambios

A través de un análisis textual, el programa puede ubicarse rápidamente en las áreas de la secuencia genética que tienen más probabilidades de estar vinculadas a los cambios en la gravedad de la variante. Superpone estos patrones con los que obtiene de una lectura separada de los metadatos del paciente (edad y sexo) y los resultados médicos (casos leves, hospitalizaciones, muertes).

El algoritmo también tiene en cuenta e intenta eliminar los sesgos debido a la forma en que los diferentes países recopilan datos. Este proceso de entrenamiento no solo permite que el programa valide las predicciones que ya ha hecho sobre la variante existente, sino que también prepara el modelo para hacer proyecciones cuando se encuentra con nuevas mutaciones en la proteína espiga.

"Cuando obtenemos una secuencia, podemos hacer una predicción sobre el riesgo de enfermedad grave de una variante antes de que los laboratorios realicen experimentos con modelos animales o cultivos celulares, o antes de que suficientes personas se enfermen como para recopilar datos epidemiológicos. En otras palabras, nuestro modelo es más como un sistema de alerta temprana para variantes emergentes", han detallado los investigadores.

Se utilizaron datos genéticos y de pacientes de la base de datos GISAID, el mayor compendio de información sobre personas que han sido infectadas con el coronavirus, para entrenar el algoritmo. Una vez que se prepararon los algoritmos, el equipo los usó para hacer proyecciones sobre las subvariantes de Omicron posteriores a BA.1 y BA.2.

"Mostramos que es más probable que las futuras subvariantes de Omicron causen una enfermedad más grave. Por supuesto, en el mundo real, esa mayor gravedad de la enfermedad se verá mitigada por una infección previa con las variantes anteriores de Omicron. Este factor también se refleja en el modelo", han enfatizado los investigadores.

El enfoque específico de Drexel para el modelado predictivo de COVID-19 es un desarrollo crucial porque la gran cantidad de datos de secuenciación genética que se recopilan ha puesto a prueba los métodos de análisis estándar para extraer información útil lo suficientemente rápido como para mantenerse al día con las nuevas mutaciones del virus.