Full text
![]() |
PDF
- Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (695kB) |
Díaz Ferreiro, Gema (2023). Búsqueda de patrones biológicos característicos en secuencias de proteínas para enfermedades nerviosas. Thesis (Master thesis), E.T.S. de Ingenieros Informáticos (UPM).
Title: | Búsqueda de patrones biológicos característicos en secuencias de proteínas para enfermedades nerviosas |
---|---|
Author/s: |
|
Contributor/s: |
|
Item Type: | Thesis (Master thesis) |
Masters title: | Ciencia de Datos |
Date: | July 2023 |
Subjects: | |
Faculty: | E.T.S. de Ingenieros Informáticos (UPM) |
Department: | Lenguajes y Sistemas Informáticos e Ingeniería del Software |
Creative Commons Licenses: | Recognition - No derivative works - Non commercial |
![]() |
PDF
- Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (695kB) |
El objetivo de este proyecto es realizar el descubrimiento de patrones simbólicos en secuencias de proteínas. Para ello, se desarrollaron diversos algoritmos para obtener los patrones idénticos con ocurrencia mínima dentro de un conjunto de datos de entrada. Tras esto, se desarrollaron técnicas de clustering con el objetivo de descartar proteínas variantes de otras a partir de un umbral de similitud definido. Como resultado, se desarrollaron dos métricas que se aplicaron a los patrones descubiertos con el fin de obtener resultados y conocer el grado de similitud de dos proteínas basándonos en los patrones que poseen. Finalmente, se llevó a cabo la creación de una interfaz gráfica con el fin de mejorar la usabilidad de los algoritmos y métricas desarrollados, así como permitir al usuario customizar los parámetros de entrada y obtener distintos resultados en función de sus necesidades.
ABSTRACT
The objective of this project is to perform the discovery of symbolic patterns in protein sequences. For this purpose, several algorithms were developed to obtain the identical patterns with minimum occurrence within a set of input data. Following this, clustering techniques were developed with the objective of discarding variant proteins from others at a defined similarity threshold. As a result, two metrics were developed and applied to the discovered patterns in order to obtain results and to know the degree of similarity of two proteins based on the patterns they possess. Finally, a graphical interface was created in order to improve the usability of the developed algorithms and metrics, as well as to allow the user to customize the input parameters and obtain different results according to their needs.
Item ID: | 75902 |
---|---|
DC Identifier: | https://oa.upm.es/75902/ |
OAI Identifier: | oai:oa.upm.es:75902 |
Deposited by: | Biblioteca Facultad de Informatica |
Deposited on: | 15 Sep 2023 10:23 |
Last Modified: | 15 Sep 2023 10:23 |