La cantidad de datos de todo tipo que se genera hoy día es tan abrumadora, prácticamente inabarcable, que explica que una herramienta como el Big Data haya irrumpido con tanta fuerza en el sector sanitario. Y dentro de él, uno de los más beneficiados es la Pediatría, ya que supone un cambio de paradigma: por primera vez en la historia se tiene acceso a datos pediátricos masivos y de manera muy rápida, lo que supone toda una revolución frente al hecho tradicional de que, al haber siempre más pacientes adultos que niños, hasta ahora era un desafío mayúsculo recopilar el suficiente número de datos para impulsar la investigación.

La generación de datos crece a tal velocidad, que los propios cálculos que se hacen quedan rápidamente obsoletos. Se estima que en el mundo se producen cada día alrededor de 2,5 quintillones de datos, y en el caso concreto de la salud, en 2012 se generaban 550 petabytes (unidad de almacenamiento de información cuyo símbolo es PB, y equivale a 1015 bytes) al año y estaba previsto alcanzar los 26.000 petabytes en 2020. Son cifras inabarcables, que por sí mismas cuesta precisar, y es que los datos en salud aumentan a un ritmo de un 48% cada año1.

Toda información es registrable, a lo que se une que los avances tecnológicos han resuelto el problema de su almacenamiento y propician su estudio, de hecho, podría decirse que hoy día hay una cantidad ilimitada de información disponible para su análisis y con unas características ideales: volumen, variedad, velocidad y veracidad. Estas son las cuatro ‘V’ que definen al Big Data, a las que se han ido sumando otras como validez, volatilidad, viabilidad, visualización y valor.

Información utilizable

El principal desafío del Big Data radica en poder convertir todo este universo de datos en información utilizable, para lo que se han ido diseñando herramientas que facilitan la captura, el procesamiento, el almacenamiento y el análisis. Tener a disposición tan ingente cantidad de datos era una utopía hace sólo unos años en Pediatría, mientras que ahora es posible abordar estudios que combinan los ensayos controlados aleatorios tradicionales con el poder de tamaños de cohorte más grandes.

Un ejemplo es lo que está ocurriendo con el cáncer pediátrico, una patología con una incidencia anual proporcionalmente baja, por lo que siempre se ha tenido que enfrentar al desafío significativo de poder recopilar datos suficientes para impulsar los descubrimientos clínicos2. Ahora, en cambio, existen proyectos como St. Jude Cloud, en el que han unido sus fuerzas el St. Jude Children’s Research Hospital y Microsoft para poner en marcha este entorno de colaboración e intercambio de datos basado en la nube.

De esta manera, los profesionales pueden consultar un amplio depósito público de datos genómicos de cáncer pediátrico, ya que aquí se almacenan y comparten miles de muestras de pacientes oncológicos asignadas a la plantilla del genoma humano. Esto permite hasta la fecha que investigadores de todo el mundo, en 450 instituciones de 16 países, intercambien datos y accedan de manera instantánea a una información que antes podía tardar semanas en descargarse3.

Montañas de datos

Con el poder del Big Data, el mismo gigante informático apoyó una línea de investigación del Seattle Children’s Research Institute centrada en la muerte súbita del lactante. La cantidad de información que se manejó fue impactante: se analizaron 26 millones de registros de nacimientos y muertes, y junto con otros conjuntos de datos, se estudiaron 90 columnas de datos sobre cada niño nacido en EEUU durante un periodo de seis años.

Al igual que Microsoft, otros colosos TIC como Google, Facebook o IBM aportan macrodatos de los que se extrae una información muy valiosa para los sistemas sanitarios, cuyos datos se suelen caracterizar por su heterogeneidad y variedad. De hecho, gran parte de esta información todavía hoy no está estructurada y no se almacena electrónicamente, es decir, sólo existen copias en papel, de ahí que ahora se esté haciendo un esfuerzo importante en su digitalización4.

El Big Data está siendo utilizado también para estudiar la seguridad de los medicamentos en los niños, un terreno en el que existen algunas limitaciones en los enfoques tradicionales. En este sentido, una investigación advierte de que “es posible que los ensayos clínicos aleatorizados dentro del contexto normativo no inscriban a pacientes que sean representativos de la población pediátrica general, no proporcionen el poder para detectar señales de seguridad raras ni datos de seguridad a largo plazo”5.

Ahora, en cambio, “se encuentran disponibles grandes bases de datos que incluyen variables de resultado específicas para niños”, un terreno en el que los países nórdicos son una referencia. De hecho, se da la paradoja de que son las naciones con mayor población pediátrica mundial las que aportan menos datos farmacoepidemiológicos, ya que la mayoría están en vías de desarrollo y tienen que avanzar todavía en su nivel tecnológico5.

Datos geolocalizados

Las organizaciones de salud de todo el mundo están acumulando más información que nunca de millones de pacientes a lo largo de sus vidas, lo que facilita proyectos como el que lidera la Universidad de Drexel (EEUU) para analizar los patrones que se encuentran en los registros de salud electrónicos cartografiados geográficamente. Con estos datos, “los investigadores pueden comprender mejor los factores relacionados con las causas de enfermedades, incluido el asma pediátrico, la obesidad infantil y las caries en la primera infancia, así como ayudar a prevenir hospitalizaciones evitables en niños”6.

Experiencias de este tipo evidencian que el Big Data tiene unas aplicaciones infinitas en Pediatría: investigación, evaluación y mejora de los pacientes, predicción de enfermedades, desarrollo de fármacos y minimización de sus efectos adversos, medicina personalizada… Para ello, eso sí, hace falta que los sistemas sanitarios españoles hagan los ajustes necesarios para aprovechar mejor los millones de registros que producen: se ha hecho una gran inversión en sistemas informáticos, pero no en herramientas para explotar los datos y transformarlos en información útil para pacientes y organizaciones7.

En España también faltan científicos de datos que sepan manejar estas montañas de información, y una ampliación de los perfiles para que trabajen de manera conjunta de informática, inteligencia artificial, ciencia de datos, biociencia y medicina. En definitiva, hay que invertir en inteligencia de datos para convertirlos en información operativa y trabajar en la interoperabilidad de los sistemas sanitarios7.

 

REFERENCIAS

  1. Zepeda Ortega AJ. Los Big Data: Conceptos relacionados y algunas aplicaciones en pediatría. Rev Chil Pediatr. 2019 Aug;90(4):376-84.
  2. Major A, Cox SM, Volchenboum SL. Using big data in pediatric oncology: Current applications and future directions. Semin Oncol. 2020 Feb;47(1):56-64.
  3. Lee P. Official Microsoft Blog (21 Mayo, 2019). Harnessing big data in pediatric research to reimagine healthcare [Blog post]. Recuperado de https://cutt.ly/wznyTe7
  4. Kumar S, Singh M. Big Data analytics for healthcare industry: impact, applications, and tools. Big Data Mining and Analytics 2019, Vol. 2 Issue (1): 48-57.
  5. McMahon AW, Cooper WO, Brown JS, Carleton B, Doshi-Velez F, Kohane I, et al. Big Data in the Assessment of Pediatric Medication Safety. Pediatrics. 2020 Feb;145(2):e20190562.
  6. Drexel University, Urban Health Collaborative (n.d.). Pediatric Big Data Project. Using Big Data methods to prevent childhood illness [nota de prensa]. Recuperado de https://cutt.ly/rznupyT
  7. Barea Mendoza J, Rovira Forns J, Quecedo Gutiérrez L, Gol Montserrat J, Del Llano Señarís J. Oportunidades y retos de los macrodatos (Big Data) en la toma de decisiones sanitarias. Fundación Gaspar Casal. 2019.