Sistema de Identificacion, Extracción y Recuperación de Secuencias Genéticas a partir de la Literatura Científica

Cuevas Candela, Alejandro (2011). Sistema de Identificacion, Extracción y Recuperación de Secuencias Genéticas a partir de la Literatura Científica. Proyecto Fin de Carrera / Trabajo Fin de Grado, Facultad de Informática (UPM).

Description

Title: Sistema de Identificacion, Extracción y Recuperación de Secuencias Genéticas a partir de la Literatura Científica
Author/s:
  • Cuevas Candela, Alejandro
Contributor/s:
  • García Remesal, Miguel
Item Type: Final Project
Date: March 2011
Subjects:
Faculty: Facultad de Informática (UPM)
Department: Inteligencia Artificial
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (4MB) | Preview

Abstract

Las tecnologías moleculares se usan con frecuencia en la práctica clínica para la identificación de microorganismos y detección de la presencia de factores virulentos, resistencia a antibióticos e interacciones huésped-paciente (Bravo et al., 2009). Por ejemplo, se han desarrollado numerosos ensayos sobre ácidos nucleicos (Mothershed et al., 2006) utilizando hibridación o técnicas de extensión de ADN que incluyen un amplio rango de tecnologías como métodos de PCR (Ratcliff et al., 2007), secuenciación de genes y genomas completos (Woo et al., 2008; Enright et al., 1999), Luminex (Pabbaraju et al., 2008) y análisis de mircoarrays (Miller et al., 2009) Existen un gran número de tecnologías que utilizan cadenas relativamente cortas de bases conocidas como primers y probes. Los primers - término inglés cuya traducción es cebador o disparador - son utilizados para la amplificación de secuencias de ADN, actuando como disparador del proceso de amplificación. Por otro lado, los probes -cuyo significado en castellano es sonda - son secuencias utilizadas para la detección de secuencias concretas que serán la cadena complementaria al probe. Primers y probes son el principal componente de los sistemas de detección basados en ácidos nucleicos y, por tanto, han sido objeto de numerosos estudios. Además, se han desarrollado sistemas software para el diseño de estas secuencias específicas de primers y probes minimizando la posible hibridación cruzada que puede ser observada, por ejemplo, como oligonucleotides en microarrays de cDNA (Li et al., 2001) o en secuencias de primers que aplifican un segmento único de un gen específico utilizando una técnica conocida como (RT)-PCR, o para la identificación de un amplio espectro de patógenos humanos (Huang et al., 2005) Tanto primers como probes son secuencias de ácidos nucleicos y no existe un estándar de representación de este tipo de cadenas en los artículos científicos. En bastantes casos, estas secuencias se encuentran delimitadas por las expresiones 5' y 5", o simplemente introducidas por la expresión 5'. No obstante, la relación de ocasiones en que estas secuencias se encuentran delimitadas o introducidas respecto del total de ocurrencias en los artículos no permite asumir esta representación. Lo que sí es común a este tipo de secuencias es que están formadas por el mismo conjunto de símbolos, que puede observarse en la Tabla 1.1. La literatura científica del área de la biología es la principal fuente de información sobre primers y probes para el diagnóstico y prescripción de enfermedades infecciosas. Las secuencias de primers y probes que aparecen en dicha literatura resultan de gran ayuda a la hora de afrontar la laboriosa tarea del diseño de nuevas secuencias con esta funcionalidad para la identificación de microorganismos y estudios de expresiones genéticas y genotipados. Por esta razón, los investigadores recurren a la búsqueda de esta información en la literatura existente. Durante los últimos años, diferentes técnicas de minería de textos, extracción de información e ingeniería del conocimiento han probado su utilidad para la extracción, análisis y visualización de información biológica a partir de la literatura científica en el área de la investigación biomédica (de la Calle et al., 2009; Hirschman et al., 2005; McDonald et al., 2005; Rice et al., 2005; Tamames, 2005; Gonzalez-Diaz et al., 2009). A pesar de que la minería de textos aplicada a datos biológicos es un campo activo de investigación, estas técnicas no han sido utilizadas todavía para la creación de métodos y herramientas cuyo objetivo sea la extracción automática de primers y probes a partir de artículos científicos. Esto supone que, en la actualidad, los investigadores normalmente recurren a la revisión de la literatura existente para obtener las secuencias de primers y probes relevantes ante las tareas de detección e identificación de microorganismos concretos, determinación de interacciones huésped-microbio o el diseño de PCR y microarrays diagnósticos. Esta revisión necesaria de la literatura es una tarea laboriosa que requiere de una considerable inversión de tiempo. En la actualidad existen algunos repositorios de secuencias que incluyen primers y/o probes. Si bien se hablará más en detalle de estos repositorios en el capítulo 2, baste destacar en este momento que dichos repositorios son mantenidos de forma manual y resultan incompletos e imprecisos. En general, los artículos científicos son publicados en medios físicos y/o digitales. No siempre la versión digital de los artículos científicos en cuestión se encuentra accesible de forma gratuita, y no siempre es posible encontrar una versión HTML. Dado que el formato PDF ofrece muchas ventajas respecto a la presentación de los documentos, este formato es el más utilizado por los investigadores y debe ser considerado como entrada para el sistema a desarrollar.

More information

Item ID: 6857
DC Identifier: http://oa.upm.es/6857/
OAI Identifier: oai:oa.upm.es:6857
Deposited by: Archivo Digital UPM
Deposited on: 04 May 2011 08:28
Last Modified: 20 Apr 2016 15:59
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM