Búsqueda de patrones biológicos característicos en secuencias de proteínas para enfermedades nerviosas

Díaz Ferreiro, Gema (2023). Búsqueda de patrones biológicos característicos en secuencias de proteínas para enfermedades nerviosas. Thesis (Master thesis), E.T.S. de Ingenieros Informáticos (UPM).

Description

Title: Búsqueda de patrones biológicos característicos en secuencias de proteínas para enfermedades nerviosas
Author/s:
  • Díaz Ferreiro, Gema
Contributor/s:
Item Type: Thesis (Master thesis)
Masters title: Ciencia de Datos
Date: July 2023
Subjects:
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Lenguajes y Sistemas Informáticos e Ingeniería del Software
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[thumbnail of TFM_GEMA_DIAZ-FERREIRO.pdf] PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (695kB)

Abstract

El objetivo de este proyecto es realizar el descubrimiento de patrones simbólicos en secuencias de proteínas. Para ello, se desarrollaron diversos algoritmos para obtener los patrones idénticos con ocurrencia mínima dentro de un conjunto de datos de entrada. Tras esto, se desarrollaron técnicas de clustering con el objetivo de descartar proteínas variantes de otras a partir de un umbral de similitud definido. Como resultado, se desarrollaron dos métricas que se aplicaron a los patrones descubiertos con el fin de obtener resultados y conocer el grado de similitud de dos proteínas basándonos en los patrones que poseen. Finalmente, se llevó a cabo la creación de una interfaz gráfica con el fin de mejorar la usabilidad de los algoritmos y métricas desarrollados, así como permitir al usuario customizar los parámetros de entrada y obtener distintos resultados en función de sus necesidades.

ABSTRACT

The objective of this project is to perform the discovery of symbolic patterns in protein sequences. For this purpose, several algorithms were developed to obtain the identical patterns with minimum occurrence within a set of input data. Following this, clustering techniques were developed with the objective of discarding variant proteins from others at a defined similarity threshold. As a result, two metrics were developed and applied to the discovered patterns in order to obtain results and to know the degree of similarity of two proteins based on the patterns they possess. Finally, a graphical interface was created in order to improve the usability of the developed algorithms and metrics, as well as to allow the user to customize the input parameters and obtain different results according to their needs.

More information

Item ID: 75902
DC Identifier: https://oa.upm.es/75902/
OAI Identifier: oai:oa.upm.es:75902
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 15 Sep 2023 10:23
Last Modified: 15 Sep 2023 10:23
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM