Sistema de Identificacion, Extracción y Recuperación de Secuencias Genéticas a partir de la Literatura Científica

Cuevas Candela, Alejandro (2011). Sistema de Identificacion, Extracción y Recuperación de Secuencias Genéticas a partir de la Literatura Científica. Trabajo Fin de Grado / Proyecto Fin de Carrera, Facultad de Informática (UPM) [antigua denominación].

Descripción

Título:	Sistema de Identificacion, Extracción y Recuperación de Secuencias Genéticas a partir de la Literatura Científica
Autor/es:	Cuevas Candela, Alejandro
Director/es:	García Remesal, Miguel https://orcid.org/0000-0002-5948-8691
Tipo de Documento:	Trabajo Fin de Grado o Proyecto Fin de Carrera
Fecha:	Marzo 2011
Materias:	Genética Informática
ODS:	02. Hambre cero 03. Salud y bienestar
Escuela:	Facultad de Informática (UPM) [antigua denominación]
Departamento:	Inteligencia Artificial
Licencias Creative Commons:	Reconocimiento - Sin obra derivada - No comercial

Texto completo

[thumbnail of PFC_Alejandro_Cuevas_Candela.pdf]

Vista Previa

PDF (Portable Document Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (4MB) | Vista Previa

Resumen

Las tecnologías moleculares se usan con frecuencia en la práctica clínica para la identificación de microorganismos y detección de la presencia de factores virulentos, resistencia a antibióticos e interacciones huésped-paciente (Bravo et al., 2009). Por ejemplo, se han desarrollado numerosos ensayos sobre ácidos nucleicos (Mothershed et al., 2006) utilizando hibridación o técnicas de extensión de ADN que incluyen un amplio rango de tecnologías como métodos de PCR (Ratcliff et al., 2007), secuenciación de genes y genomas completos (Woo et al., 2008; Enright et al., 1999), Luminex (Pabbaraju et al., 2008) y análisis de mircoarrays (Miller et al., 2009) Existen un gran número de tecnologías que utilizan cadenas relativamente cortas de bases conocidas como primers y probes. Los primers - término inglés cuya traducción es cebador o disparador - son utilizados para la amplificación de secuencias de ADN, actuando como disparador del proceso de amplificación. Por otro lado, los probes -cuyo significado en castellano es sonda - son secuencias utilizadas para la detección de secuencias concretas que serán la cadena complementaria al probe. Primers y probes son el principal componente de los sistemas de detección basados en ácidos nucleicos y, por tanto, han sido objeto de numerosos estudios. Además, se han desarrollado sistemas software para el diseño de estas secuencias específicas de primers y probes minimizando la posible hibridación cruzada que puede ser observada, por ejemplo, como oligonucleotides en microarrays de cDNA (Li et al., 2001) o en secuencias de primers que aplifican un segmento único de un gen específico utilizando una técnica conocida como (RT)-PCR, o para la identificación de un amplio espectro de patógenos humanos (Huang et al., 2005) Tanto primers como probes son secuencias de ácidos nucleicos y no existe un estándar de representación de este tipo de cadenas en los artículos científicos. En bastantes casos, estas secuencias se encuentran delimitadas por las expresiones 5' y 5", o simplemente introducidas por la expresión 5'. No obstante, la relación de ocasiones en que estas secuencias se encuentran delimitadas o introducidas respecto del total de ocurrencias en los artículos no permite asumir esta representación. Lo que sí es común a este tipo de secuencias es que están formadas por el mismo conjunto de símbolos, que puede observarse en la Tabla 1.1. La literatura científica del área de la biología es la principal fuente de información sobre primers y probes para el diagnóstico y prescripción de enfermedades infecciosas. Las secuencias de primers y probes que aparecen en dicha literatura resultan de gran ayuda a la hora de afrontar la laboriosa tarea del diseño de nuevas secuencias con esta funcionalidad para la identificación de microorganismos y estudios de expresiones genéticas y genotipados. Por esta razón, los investigadores recurren a la búsqueda de esta información en la literatura existente. Durante los últimos años, diferentes técnicas de minería de textos, extracción de información e ingeniería del conocimiento han probado su utilidad para la extracción, análisis y visualización de información biológica a partir de la literatura científica en el área de la investigación biomédica (de la Calle et al., 2009; Hirschman et al., 2005; McDonald et al., 2005; Rice et al., 2005; Tamames, 2005; Gonzalez-Diaz et al., 2009). A pesar de que la minería de textos aplicada a datos biológicos es un campo activo de investigación, estas técnicas no han sido utilizadas todavía para la creación de métodos y herramientas cuyo objetivo sea la extracción automática de primers y probes a partir de artículos científicos. Esto supone que, en la actualidad, los investigadores normalmente recurren a la revisión de la literatura existente para obtener las secuencias de primers y probes relevantes ante las tareas de detección e identificación de microorganismos concretos, determinación de interacciones huésped-microbio o el diseño de PCR y microarrays diagnósticos. Esta revisión necesaria de la literatura es una tarea laboriosa que requiere de una considerable inversión de tiempo. En la actualidad existen algunos repositorios de secuencias que incluyen primers y/o probes. Si bien se hablará más en detalle de estos repositorios en el capítulo 2, baste destacar en este momento que dichos repositorios son mantenidos de forma manual y resultan incompletos e imprecisos. En general, los artículos científicos son publicados en medios físicos y/o digitales. No siempre la versión digital de los artículos científicos en cuestión se encuentra accesible de forma gratuita, y no siempre es posible encontrar una versión HTML. Dado que el formato PDF ofrece muchas ventajas respecto a la presentación de los documentos, este formato es el más utilizado por los investigadores y debe ser considerado como entrada para el sistema a desarrollar.

Más información

ID de Registro:	6857
Identificador DC:	https://oa.upm.es/6857/
Identificador OAI:	oai:oa.upm.es:6857
Depositado por:	Archivo Digital UPM
Depositado el:	04 May 2011 08:28
Ultima Modificación:	06 Mar 2023 11:38

Estadísticas

Exportar cita

Editar (sólo personal del Archivo)

En esta página

Menú principal

Buscar

Sistema de Identificacion, Extracción y Recuperación de Secuencias Genéticas a partir de la Literatura Científica

Cita

Descripción

Texto completo

Resumen

Más información

Acciones

Documentos

El repositorio

Agrupados por ...

Datos Investigación

Financiadores

Especiales

En otros formatos

Redes sociales

Información adicional