Optimización de procesos de adquisición de conocimiento en Biología Computacional

González Tortosa, Santiago (2010). Optimización de procesos de adquisición de conocimiento en Biología Computacional. Tesis (Doctoral), Facultad de Informática (UPM) [antigua denominación]. https://doi.org/10.20868/UPM.thesis.4742.

Descripción

Título: Optimización de procesos de adquisición de conocimiento en Biología Computacional
Autor/es:
  • González Tortosa, Santiago
Director/es:
Tipo de Documento: Tesis (Doctoral)
Fecha de lectura: 18 Octubre 2010
Materias:
ODS:
Palabras Clave Informales: Cancer, DNA microarray, clinical, data mining, clinical tree, validation
Escuela: Facultad de Informática (UPM) [antigua denominación]
Departamento: Arquitectura y Tecnología de Sistemas Informáticos
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[thumbnail of SANTIAGO_GONZALEZ_TORTOSA.pdf]
Vista Previa
PDF (Portable Document Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (2MB) | Vista Previa

Resumen

Tradicionalmente, los datos clínicos han sido la única fuente de información para el diagnóstico de enfermedades. Hoy en día, existen otros tipos de información, como Microarrays de ADN, que permiten mejorar el diagnóstico y pronóstico en muchas enfermedades. Esta tesis propone un nuevo enfoque, denominado CliDaPa, para combinar eficientemente ambas fuentes de información (datos clínicos y genéticos), de forma que se mejoren las estimaciones. Para ello, en primer lugar, los pacientes se segmentan utilizando una representación en árbol a través de sus datos clínicos (árbol clínico). Por tanto, se identifican distintas agrupaciones de pacientes según comportamientos similares. A continuación, se analiza cada agrupación independientemente con la información genética asociada, mediante técnicas de minería de datos. Para demostrar su validez, el método se aplica a distintos conjuntos de datos reales (sobre cáncer de mama y de cerebro). La validación de los resultados se basa en dos métodos de validación, interna y externa, utilizando para ello el Centro de Supercomputación y Visualización de Madrid (CeSViMa), en donde se ejecutaron los tres enfoques paralelizados del algoritmo. Los resultados obtenidos se comparan con distintos estudios de la literatura, así como con las técnicas de análisis tradicionales, demostrando una mejora significativa en los resultados existentes.

Más información

ID de Registro: 4742
Identificador DC: https://oa.upm.es/4742/
Identificador OAI: oai:oa.upm.es:4742
Identificador DOI: 10.20868/UPM.thesis.4742
Depositado por: Doctor Santiago González Tortosa
Depositado el: 27 Oct 2010 10:28
Ultima Modificación: 08 Mar 2023 10:19