En un avance significativo para la medicina moderna, investigadores de la
Facultad de Medicina Grossman de la Universidad de Nueva York han desarrollado una herramienta de
inteligencia artificial (IA) que puede redactar respuestas a las consultas de los pacientes en sus
historias clínicas electrónicas con la misma precisión que los profesionales de la salud humanos. Además, se ha observado que estas respuestas son percibidas como más empáticas.
Evaluación de la IA en la atención médica
Publicado en
JAMA Network Open, el estudio examinó las respuestas generadas por GPT-4 a las consultas de los pacientes. Los investigadores pidieron a médicos de atención primaria que compararan estos borradores con respuestas humanas reales. 'Nuestros resultados sugieren que los chatbots podrían reducir la carga de trabajo de los proveedores de atención médica al permitir respuestas eficientes y empáticas a las preocupaciones de los pacientes', señala el doctor William Small, profesor clínico adjunto en el Departamento de Medicina de la Facultad de Medicina Grossman de la Universidad de Nueva York.
El estudio contó con la participación de dieciséis médicos de atención primaria que evaluaron 344 pares de respuestas, tanto de IA como humanas, en términos de precisión, relevancia, integridad y tono. Los médicos desconocían el origen de las respuestas, lo que garantizó una evaluación imparcial (estudio ciego).
Resultados y hallazgos clave
El equipo de investigación descubrió que la precisión, integridad y relevancia de las respuestas de la IA y de los proveedores humanos no diferían estadísticamente. Sin embargo, las respuestas de la IA superaron a las humanas en términos de comprensibilidad y tono en un 9,5 %. Además, las respuestas generadas por la IA tenían más del doble de probabilidades de ser consideradas empáticas y un 62 % más de probabilidades de utilizar un lenguaje positivo y afiliativo.
Las respuestas de la IA también tendían a ser un 38 % más largas y un 31 % más propensas a utilizar un lenguaje complejo. Mientras que los humanos respondieron a las consultas de los pacientes a un nivel de sexto grado, la IA escribía a un nivel de octavo grado, según la puntuación Flesch Kincaid de legibilidad. Esto sugiere que la IA podría necesitar un mayor entrenamiento para adecuar su nivel de lenguaje a la audiencia de los pacientes.
Implicaciones para el futuro de la atención médica
El doctor Devin Mann, director sénior de Innovación Informática en Tecnología de la Información del
Centro Médico Langone de la Universidad de Nueva York, destacó la importancia de estos hallazgos. 'Este trabajo demuestra que la herramienta de IA puede generar borradores de respuestas de alta calidad a las solicitudes de los pacientes', afirmó Mann. 'Con esta aprobación médica, la calidad de los mensajes de GenAI será igual en el futuro cercano en calidad, estilo de comunicación y facilidad de uso a las respuestas generadas por humanos'.
El estudio subraya el potencial de la IA para mejorar la comunicación entre médicos y pacientes, especialmente en un entorno donde la carga de trabajo de los profesionales de la salud es considerable. Utilizando información privada de los pacientes, en lugar de datos generales de Internet, la IA puede ofrecer respuestas más precisas y contextualmente relevantes. Se necesitarán estudios futuros para confirmar si estos datos privados mejoran específicamente el rendimiento de las herramientas de IA.
En resumen, la integración de herramientas de IA en la práctica clínica no solo promete aliviar la carga de trabajo de los médicos, sino también mejorar la calidad de la atención al paciente a través de respuestas precisas y empáticas. Para más información sobre este estudio, consulte
JAMA Network Open.