Un estudio de la revista Scientific Reports del grupo editorial Nature revela el sesgo de los algoritmos basados en la inteligencia artificial (IA) para diagnosticar síndromes genéticos y enfermedades raras mediante biomarcadores faciales. Según expertos de la UB, la Universidad Icesi de Colombia, y la Universidad Ramon Llull, los algoritmos de diagnóstico de la IA están optimizados para poblaciones europeas, pero son menos precisos en poblaciones mestizas con distinta ascendencia genética. De esta forma, incorporar poblaciones con ascendencia amerindia, africana, asiática y europea en los algoritmos generados por la IA es decisivo para mejorar los métodos para el diagnóstico de enfermedades raras.

Cabe tener en cuenta que hasta el 40 por ciento de las enfermedades raras presentan alteraciones faciales que permiten diferenciar algunas patologías entre sí y que incluso ayudan a establecer un primer diagnóstico. Tradicionalmente, la evaluación visual y el uso de algunas medidas antropométricas clásicas —como el diámetro de la cabeza, entre otros— han facilitado un primer diagnóstico de enfermedades raras. Ahora, con las técnicas más sofisticadas y automáticas —basadas en la inteligencia artificial (IA)— es posible aplicar métodos más objetivos en el diagnóstico. Sin embargo, la mayoría de los algoritmos generados por la IA parten de bases de datos de poblaciones de origen europeo e ignoran la diversidad genética y morfológica de las poblaciones humanas de todo el mundo.

Diagnóstico de enfermedades raras

El diagnóstico automático basado en la IA puede revelar patrones de dismorfologías severas o leves que son características de cada síndrome, “pero con diferencias significativas detectables cuando se realiza un análisis cuantitativo de la morfología facial”, explica la profesora Neus Martínez-Abadías, experta en antropología biológica y miembro del Departamento de Biología Evolutiva, Ecología y Ciencias Ambientales de la UB.

Para llegar a esta conclusión, se utilizó un algoritmo de inteligencia artificial, conocido como Face2Gene, que se utiliza en la práctica clínica para identificar este tipo de trastornos mediante el análisis de las características morfométricas de la cara. En el caso de los síndromes de Down y de Morquio, se pudo comparar los resultados de diagnóstico entre la muestra colombiana y una europea.

Según los resultados, las personas diagnosticadas con SD y SM presentaron las dismorfologías faciales más severas, con el 58,2 por ciento y el 65,4 por ciento de los rasgos faciales significativamente distintos en las personas respecto a la población control. El fenotipo fue más leve en SN (47,7 por ciento) y no significativo en NF1 (11,4 por ciento). La precisión diagnóstica del algoritmo automático de aprendizaje profundo empleado en el estudio fue muy alta en el caso del SD, moderada en el SN y muy baja (inferior a 10 por ciento) en SM y NF1.