Los algoritmos de inteligencia artificial detrás del programa de chatbot ChatGPT, que ha llamado la atención por su capacidad para generar respuestas escritas similares a las humanas a algunas de las consultas más creativas, algún día podrían ayudar a los médicos a detectar la enfermedad de Alzheimer en sus primeras etapas. La investigación de la Escuela de Ingeniería Biomédica, Ciencias y Sistemas de Salud de la Universidad de Drexel demostró recientemente que el programa GPT-3 de OpenAI puede identificar pistas del habla espontánea que tienen un 80% de precisión para predecir las primeras etapas de la demencia.
El estudio Drexel, publicado en la revista PLOS Digital Health, es el último de una serie de esfuerzos para mostrar la eficacia de los programas de procesamiento del lenguaje natural para la predicción temprana de la enfermedad de Alzheimer, aprovechando las investigaciones actuales que sugieren que el deterioro del lenguaje puede ser un indicador temprano de trastornos neurodegenerativos.
La práctica actual para el diagnóstico de la enfermedad de Alzheimer normalmente implica una revisión del historial médico y un largo conjunto de evaluaciones y pruebas físicas y neurológicas. Si bien todavía no existe una cura para la enfermedad, detectarla a tiempo puede brindar a los pacientes más opciones terapéuticas y de apoyo. Debido a que el deterioro del lenguaje es un síntoma en el 60-80 % de los pacientes con demencia, los investigadores se han centrado en programas que pueden captar pistas sutiles, como vacilación, cometer errores de gramática y pronunciación y olvidar el significado de las palabras, como una solución rápida prueba que podría indicar si un paciente debe someterse o no a un examen completo.
«Sabemos por investigaciones en curso que los efectos cognitivos de la enfermedad de Alzheimer pueden manifestarse en la producción del lenguaje», dijo Hualou Liang, PhD, profesor de la Escuela de Ingeniería Biomédica, Ciencias y Sistemas de Salud de Drexel y coautor de la investigación. «Las pruebas más utilizadas para la detección temprana de la enfermedad de Alzheimer analizan las características acústicas, como las pausas, la articulación y la calidad vocal, además de las pruebas de cognición. Pero creemos que la mejora de los programas de procesamiento del lenguaje natural ofrece otra vía para apoyar la identificación temprana de alzhéimer».
GPT-3, oficialmente la tercera generación de General Pretrained Transformer (GPT) de OpenAI, utiliza un algoritmo de aprendizaje profundo, entrenado mediante el procesamiento de vastas franjas de información de Internet, con un enfoque particular en cómo se usan las palabras y cómo se construye el lenguaje. Este entrenamiento le permite producir una respuesta humana a cualquier tarea que involucre el lenguaje, desde respuestas a preguntas simples, hasta escribir poemas o ensayos.
GPT-3 es particularmente bueno en el «aprendizaje de datos cero», lo que significa que puede responder a preguntas que normalmente requerirían conocimiento externo que no se ha proporcionado. Por ejemplo, pedirle al programa que escriba «Notas de Cliff» de un texto, normalmente requeriría una explicación de que esto significa un resumen. Pero GPT-3 ha pasado por suficiente entrenamiento para entender la referencia y adaptarse para producir la respuesta esperada.
«El enfoque sistémico de GPT3 para el análisis y la producción del lenguaje lo convierte en un candidato prometedor para identificar las características sutiles del habla que pueden predecir la aparición de la demencia», dijo Felix Agbavor, investigador de doctorado en la Facultad y autor principal del artículo. «Entrenar a GPT-3 con un conjunto masivo de datos de entrevistas, algunas de las cuales son con pacientes de Alzheimer, le proporcionaría la información que necesita para extraer patrones del habla que luego podrían aplicarse para identificar marcadores en futuros pacientes».
Los investigadores probaron su teoría entrenando el programa con un conjunto de transcripciones de una parte de un conjunto de datos de grabaciones de voz compiladas con el apoyo de los Institutos Nacionales de Salud específicamente con el propósito de probar la capacidad de los programas de procesamiento del lenguaje natural para predecir la demencia. El programa capturó características significativas del uso de las palabras, la estructura de las oraciones y el significado del texto para producir lo que los investigadores llaman una «incrustación», un perfil característico del habla de la enfermedad de Alzheimer.
Luego usaron la incrustación para volver a entrenar el programa, convirtiéndolo en una máquina de detección de Alzheimer. Para probarlo, le pidieron al programa que revisara docenas de transcripciones del conjunto de datos y decidiera si cada una fue producida o no por alguien que estaba desarrollando la enfermedad de Alzheimer.
Al ejecutar dos de los mejores programas de procesamiento de lenguaje natural a la misma velocidad, el grupo encontró que GPT-3 funcionó mejor que ambos, en términos de identificar con precisión ejemplos de Alzheimer, identificar ejemplos que no son de Alzheimer y con menos casos perdidos que ambos programas.
Una segunda prueba usó el análisis textual de GPT-3 para predecir la puntuación de varios pacientes del conjunto de datos en una prueba común para predecir la gravedad de la demencia, llamada Mini-Mental State Exam (MMSE).
Luego, el equipo comparó la precisión de predicción de GPT-3 con la de un análisis que utilizó solo las características acústicas de las grabaciones, como pausas, fuerza de voz y dificultad para predecir la puntuación MMSE. GPT-3 demostró ser casi un 20 % más preciso en la predicción de las puntuaciones MMSE de los pacientes.
«Nuestros resultados demuestran que la incrustación de texto, generada por GPT-3, se puede utilizar de forma fiable no solo para detectar personas con enfermedad de Alzheimer de controles sanos, sino también para inferir la puntuación de las pruebas cognitivas del sujeto, ambas basadas únicamente en los datos del habla», escribieron. . «Además, demostramos que la incrustación de texto supera el enfoque convencional basado en características acústicas e incluso funciona de manera competitiva con modelos ajustados. Estos resultados, en conjunto, sugieren que la incrustación de texto basada en GPT-3 es un enfoque prometedor para la evaluación de AD y tiene el potencial para mejorar el diagnóstico precoz de la demencia».
Para aprovechar estos resultados prometedores, los investigadores planean desarrollar una aplicación web que podría usarse en el hogar o en el consultorio de un médico como una herramienta de preselección.
«Nuestra prueba de concepto muestra que esta podría ser una herramienta simple, accesible y adecuadamente sensible para las pruebas basadas en la comunidad», dijo Liang. «Esto podría ser muy útil para la detección temprana y la evaluación de riesgos antes de un diagnóstico clínico».