Aplicación de redes neuronales convolucionales y recurrentes al diagnóstico de autismo a partir de resonancias magnéticas funcionales

Rodríguez-Sahagún Alesanco, Pablo (2018). Aplicación de redes neuronales convolucionales y recurrentes al diagnóstico de autismo a partir de resonancias magnéticas funcionales. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. Industriales (UPM), Madrid.

Description

Title: Aplicación de redes neuronales convolucionales y recurrentes al diagnóstico de autismo a partir de resonancias magnéticas funcionales
Author/s:
  • Rodríguez-Sahagún Alesanco, Pablo
Contributor/s:
Item Type: Final Project
Degree: Grado en Ingeniería en Tecnologías Industriales
Date: February 2018
Subjects:
Freetext Keywords: Autismo, resonancias magnéticas funcionales cerebrales, ABIDE, Deep Learning, redes neuronales, redes convolucionales, redes recurrentes, redes híbridas.
Faculty: E.T.S.I. Industriales (UPM)
Department: Ingeniería de Organización, Administración de Empresas y Estadística
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[thumbnail of TFG_PABLO_RODRIGUEZ_SAHAGUN_ALESANCO.pdf]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (10MB) | Preview

Abstract

Introducción. El autismo o trastorno del espectro autista engloba un grupo de complejos desórdenes del cerebro humano. Estos desórdenes se caracterizan por la dificultad a la hora de interaccionar de manera social, comunicarse verbal y no verbalmente, así como una tendencia a la repetición de comportamientos. Según estadísticas recientes, en Estados Unidos 1 de cada 70 niños aproximadamente padece algún trastorno relacionado con el trastorno del espectro autista. El presente Trabajo de Fin de Grado surge de la idea de aplicar las herramientas propias del área del Deep Learning en la investigación y estudio de un área en constante innovación como el análisis de imagen médico, para efectuar un posterior diagnóstico. Más concretamente, el estudio se centra en la iniciativa ABIDE (Autism Brain Imaging Data Exchange), una base de datos formada por 1112 resonancias magnéticas funcionales cerebrales, de las cuales 539 pertenecen a personas autistas, y 573 a personas que ejercen la labor de control. Objetivos. El principal objetivo de este proyecto es conseguir aplicar una red neuronal con una arquitectura novedosa, a la que se denominar´a de aquí en adelante híbrida, que consistirá en la combinación de una red neuronal de tipo convolucional y una red neuronal de tipo recurrente para, mediante el análisis de las resonancias magnéticas funcionales cerebrales de pacientes, ser capaces de distinguir entre aquellos que presentan trastorno del espectro autista y aquellos que no. De manera adicional se presentará la utilidad de los índices ALFF y fALFF en la caracterización del autismo. Estos índices miden las oscilaciones espontaneas de baja frecuencia del cerebro, y han resultado ser una alternativa a las resonancias magnéticas funcionales cerebrales sin procesamiento alguno. Con el fin de estructurar este Trabajo de Fin de Grado, este objetivo global se conseguirá cuando se concluyan con éxito cada una de las fases en las que se ha decidido subdividir el proyecto. Estas fases son las siguientes: • Descarga de Amazon Web Services y posterior almacenamiento de los datos de los índices ALFF y fALFF de las resonancias magnéticas funcionales de los pacientes, así como la base de datos con sus fenotipos asociados. • Estudio preliminar de los fenotipos de los pacientes (distribución por autista o control, sexo, edad y IQ). • Preprocesamiento de los datos y formación de cadenas de vídeo, donde los fotogramas serán cortes cerebrales seg´un el eje z de coordenadas ascendente. • Desarrollo de la arquitectura de la red neuronal híbrida, y posterior simulación y elección de los parámetros de la red. • Obtención de resultados de clasificación y comparación con estudios similares. Base de datos ABIDE La base de datos ABIDE es una cooperativa conjunta de mas de 25 universidades y centros de investigación a lo largo de todo el mundo. La distribución en términos de pacientes con autismo o no, y sexo es la siguiente: La propia iniciativa ABIDE ofrece varias métricas asociadas a las resonancias magnéticas funcionales cerebrales de los sujetos participantes en el estudio. Como se ha mencionado anteriormente, en el presente Trabajo de Fin de Grado se ha utilizado la métrica ALFF, ya que es con la que mejor resultados se han obtenido.Se define el índice ALFF mediante la siguiente expresión matemática. Metodología. En primer lugar, se ha procedido a la descarga de los datos de la iniciativa ABIDE (las resonancias magnéticas funcionales cerebrales de los pacientes y una base de datos en Microsoft Excel de sus fenotipos asociados), mediante un programa desarrollado en Python para descargar de manera automática los datos, ya que la plataforma Amazon Web Services, en la que se encontraban alojados los datos, solo permitía descargar los datos de los pacientes de uno en uno. Posteriormente se ha procedido al estudio de las diferentes opciones existentes de lenguajes de programación con librerías orientadas al desarrollo de modelos de Deep Learning, eligiéndose Python como lenguaje de programaci´on debido a la amplia comunidad de usuarios que lo soporta, además de la cantidad de funcionalidades que permite. Como framework de Deep Learning se ha optado por Tensorflow, una librería especializada en Deep Learning desarrollada por Google, y que aunque no es la que mayor rendimiento aporta, es la que tiene más perspectivas de futuro. A continuación se ha realizado una revisión de estudios científicos sobre modelos de Deep Learning aplicados al estudio de la iniciativa ABIDE. La mayoría de los estudios optan por utilizar una red neuronal convolucional, realizando las convoluciones en 2 dimensiones o en 3 dimensiones. Una red neuronal convolucional es un tipo de red neuronal especialmente recomendado para su uso en datos con una topología de mallado o grid. Esto las hace especialmente útiles en el tratamiento de imágenes. La entrada a la red convolucional será un tensor de datos (por ejemplo una imagen), y se utilizará un kernel o tensor móvil formado por pesos que se modificaran a lo largo del aprendizaje de la red, para obtener el resultado de la operación de convolución de ambos. Sin embargo, las redes convolucionales en tres dimensiones requieren de una gran capacidad computacional para su utilización, lo que supone un gran inconveniente, ya que el equipo del que se dispone no es especialmente potente. Realizando una búsqueda más en profundidad, se han encontrado referencias al uso de redes neuronales recurrentes, más en concreto del tipo LSTM, debido a la dimensión temporal que presentan los escáneres por resonancia magnética funcional. Las redes neuronales recurrentes son otro tipo de redes neuronales cuya principal tarea es la de tratar con datos en forma de serie o secuencia. Los estados de la red en el instante temporal t se ven afectados por los estados anteriores. Sin embargo, las redes neuronales recurrentes sufren un fenómeno llamado desaparición del gradiente, por el cual la información entre estados temporales muy separados se pierde. Para remediar este problema de las dependencias temporales a largo plazo surgen un tipo especial de redes neuronales recurrentes llamadas LSTM y GRU. Nace así la idea de utilizar los dos tipos de redes neuronales juntas, tomando las 3 dimensiones espaciales (dirección x, dirección, dirección z), y transformándolas en 2 dimensiones espaciales que serán las que gestione la parte convolucional de la red, y una dimensión temporal, que se corresponderá con la dirección z, y que será gestionada por la parte recurrente. La arquitectura de la red neuronal es la siguiente, donde est´an se˜nalados de color verde el primer bloque convolucional, de color azul oscuro el segundo bloque convolucional, y de color rojo el bloque recurrente y final. De manera más intuitiva, la nueva estructura de los datos podría asimilarse a la de una secuencia de video, donde los fotogramas son cada uno de los cortes cerebrales en el eje z, con sentido del eje z creciente. Cada fotograma de la secuencia de vídeo (imágenes en dos dimensiones) pasará por separado a través de los dos bloques convolucionales de la red neuronal. La salida de estos bloques será dispuesta en forma de secuencia, y esta secuencia será analizada por el bloque recurrente de la red neuronal. La intención es que para la red sea más fácil clasificar las resonancias magnéticas funcionales con una secuencia, ya que dispondrá de un contexto, que con fotogramas individuales sin conexión alguna. Para conseguir la estructura de datos deseada, se han realizado varias operaciones de procesamiento de los datos. Primero se ha especificado un formato de numero en coma flotante con 32 decimales de precisión. Posteriormente se han formado las secuencias de datos de las resonancias magnéticas funcionales, obteniéndose un tensor de cuatro dimensiones (número de sujetos, coordenadas dirección x, coordenadas dirección y, coordenadas dirección z) de un tamaño muy grande (1008 sujetos * 61 voxeles dirección x * 73 voxeles dirección y * 61 voxeles dirección z). Por último, se han realizado numerosas simulaciones con la arquitectura híbrida previamente expuesta para elegir los parámetros de la red que consigan el máximo rendimiento. Entre estos parámetros destacan la elección del ratio de aprendizaje, del valor del término de regularización, la elección de la probabilidad de dropout o que cortes cerebrales formarán las secuencias de vídeo a analizar entre otros. Resultados. Para la evaluación de los resultados es una práctica común el dividir el número total de datos en datos para entrenamiento y datos para test. La red neuronal híbrida va aprendiendo y entrenándose con los datos de entrenamiento, para posteriormente ponerse a prueba con los datos reservados para el test. Los resultados han sido especialmente buenos, ya que son parecidos, e incluso en ocasiones superiores, a los obtenidos por otros estudios de investigación en el mismo campo. El principal problema que se ha experimentado en el desarrollo del proyecto ha sido la aparición del fenómeno de sobreajuste u overfitting, por el cual la red neuronal aprende de memoria los datos de entrenamiento, no consiguiendo generalizar de manera correcta a datos vistos por primera vez. Para intentar solucionar este problema se han llevado a cabo las siguientes acciones: • Se ha utilizado un valor relativamente alto para el termino de regularización L2. Este término impone una penalización a los pesos con valores altos, lo que previene la aparición del sobreajuste. • Se ha aplicado un dropout muy agresivo, mediante el cual se consigue reducir de manera notable el sobreajuste. El dropout es una técnica del Deep Learning mediante la cual se obvian de manera aleatoria nodos y sus respectivas conexiones dentro de la red neuronal, lo que evita que la red se adapte demasiado a los ejemplos provistos durante el entrenamiento. • Por último se han realizado ensembles de diferentes modelos, de cara a reducir la variabilidad de las simulaciones debida a numerosos factores, obteniendo así modelos finales más robustos. Por último, se ha realizado un k-fold cross validation con k=6, donde se subdividen la totalidad de los datos en paquetes (en este caso 6 paquetes), y se va rotando que paquetes forman los datos de entrenamiento y que paquete forma el de test, realizando un total de 6 combinaciones diferentes. Se han obtenido las siguientes precisiones en los datos de test. Conclusiones. Las conclusiones que se pueden extraer tras completar este Trabajo de Fin de Grado son varias. En primer lugar, se ha mostrado la utilidad de aplicación de índices y medidas asociadas (ALFF y fALFF) a las resonancias magnéticas funcionales de los pacientes, en vez de las resonancias magnéticas sin ningún tipo de procesamiento. En segundo lugar, se ha corroborado la eficacia y buen rendimiento de las herramientas englobadas en el deep learning para la resolución de problemas complejos, siendo las aplicaciones posibles para el deep learning inimaginables. Por último, se introduce el uso de redes neuronales híbridas al campo del análisis de imagen médico, exponiendo que este tipo de redes conllevan una mejoría en términos de precisión en la clasificación, lo que abre un enorme abanico de posibilidades.

More information

Item ID: 50400
DC Identifier: https://oa.upm.es/50400/
OAI Identifier: oai:oa.upm.es:50400
Deposited by: Biblioteca ETSI Industriales
Deposited on: 20 Apr 2018 16:23
Last Modified: 13 Dec 2022 11:46
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM