Explainable Machine Learning for longitudinal multi-omic microbiome

Laccourreye Matamala, Paula (2021). Explainable Machine Learning for longitudinal multi-omic microbiome. Thesis (Master thesis), E.T.S. de Ingenieros Informáticos (UPM).

Description

Title: Explainable Machine Learning for longitudinal multi-omic microbiome
Author/s:
  • Laccourreye Matamala, Paula
Contributor/s:
  • Bielza Lozoya, María Concepción
  • Larrañaga Múgica, Pedro
Item Type: Thesis (Master thesis)
Masters title: Inteligencia Artificial
Date: July 2021
Subjects:
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Inteligencia Artificial
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (5MB) | Preview

Abstract

La enfermedad inflamatoria intestinal (EII) engloba la enfermedad de Crohn y la colitis ulcerosa, dos patologías crónicas relacionadas con la inflamación del tracto gastrointestinal. Si bien se desconoce la causa exacta de la EII, existe una conexión clave entre la comunidad microbiana en el intestino, los genes y el sistema inmunológico. Lo mismo ocurre con otras enfermedades relacionadas con estos factores, como asma, diabetes, obesidad o cáncer colorrectal. Por esta razón, la investigación del microbioma humano se está convirtiendo en un foco de interés cada vez mayor en la salud humana y ha atraído la atención de grandes consorcios de investigación como el proyecto NIH Human Microbiome en Estados Unidos o MetaHIT en Europa. Los conjuntos de datos de microbiomas son únicos en su caracterizada alta dimensionalidad y dispersión. Además, las comunidades microbianas son dinámicas y su composición cambia con el tiempo. Los avances recientes en la secuenciación de alto rendimiento han llevado a una explosión de datos multiómicos de diferentes fuentes que pueden proporcionar importantes conocimientos biológicos. Por lo tanto, los desafíos actuales en el estudio de los datos del microbioma humano implican el manejo de datos multidominio (heterogéneos), con alta dimensionalidad, así como el análisis de series temporales (datos irregularmente espaciados y escasos). Sin embargo, las soluciones actuales para comprender mejor las relaciones entre el microbioma humano y las enfermedades no se han abordado en profundidad. En consecuencia, se deben explorar y desarrollar nuevos métodos explicables, dinámicos y multiómicos para el análisis del microbioma. Las redes bayesianas posibilitan un enfoque interesante ya que nos ayudan a comprender las formas básicas en que las diferentes entidades biológicas (taxones, genes, metabolitos) interactúan entre sí en un entorno determinado (por ejemplo el intestino humano). En este trabajo se han desarrollado un conjunto de pasos de preprocesamiento para limpiar, filtrar, seleccionar e integrar con éxito datos longitudinales de metagenómica, metatranscriptómica y metabolómica procedentes del proyecto del microbioma humano. Proponemos un enfoque de red bayesiana dinámica que puede ayudar a construir modelos dinámicos que capturen el comportamiento del microbioma humano para comprender cómo la comunidad microbiana se comunica con el huésped y contribuye a la enfermedad. En concreto para este proyecto, estudiaremos enfermedades inflamatorias del intestino (EII): la enfermedad de Crohn y la colitis ulcerosa. Nuestra solución propuesta será muy valiosa para la actual y emergente medicina de precisión.---ABSTRACT---Inflammatory bowel disease (IBD) encompasses Crohn’s disease and ulcerative colitis, two chronic disorders involving inflammation of the gastrointestinal tract. While the exact cause of IBD remains unknown, there is a key connection between the microbial community in the gut, genes, and the immune system. The same occurs with other disease conditions related to these factors such as asthma, diabetes, obesity, or colorectal cancer. For this reason, microbiome research is becoming an increasing major focus of interest in human health and has attracted the attention of large research consortiums such as the NIH Human Microbiome project in United States or MetaHIT in Europe. Microbiome data sets are unique in their characterized high dimensionality and sparsity. Moreover, microbial communities are dynamic, and their compositions change with time. Recent advances in high-throughput sequencing have led to explosion of multi-omic data from different sources that are able to provide important biological insights. Thus, current challenges of studying microbiome data involve multidomain data (heterogeneity), high dimensionality and time series analysis (sparse and irregularly spaced data). However, current solutions to better understand relationships between the human microbiome and disease have not been dealt with in depth. Consequently, new explainable, dynamic, and multi-omic methods to microbiome analysis must be explored and developed. Bayesian networks are an interesting approach as they help us understanding of the basic ways the different biological entities (taxa, genes, metabolites) interact with each other in a given environment (human gut). We develop a set of preprocessing steps to successfully clean, filter, select and integrate informative metagenomics, metatranscriptomics and metabolomics longitudinal data from the Human Microbiome Project. We propose a dynamic Bayesian network approach that can assist in building dynamic models to capture the behavior of the human microbiome to understand how the microbial community communicates with the host and contributes toward disease. Specifically for this project, we will study inflammatory bowel diseases (IBD): Crohn's disease and ulcerative colitis. Our proposed solution will be very valuable for current and emerging predictive precision medicine.

More information

Item ID: 68639
DC Identifier: https://oa.upm.es/68639/
OAI Identifier: oai:oa.upm.es:68639
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 25 Sep 2021 10:05
Last Modified: 25 Sep 2021 10:05
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM