Full text
Preview |
PDF
- Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (2MB) | Preview |
Pérez Espinoza, Charles (2015). Uso de técnicas de minería de texto para la identificación de ensayos clínicos en nanomedicina. Thesis (Master thesis), E.T.S. de Ingenieros Informáticos (UPM).
Title: | Uso de técnicas de minería de texto para la identificación de ensayos clínicos en nanomedicina |
---|---|
Author/s: |
|
Contributor/s: |
|
Item Type: | Thesis (Master thesis) |
Masters title: | Inteligencia Artificial |
Date: | July 2015 |
Subjects: | |
Faculty: | E.T.S. de Ingenieros Informáticos (UPM) |
Department: | Inteligencia Artificial |
Creative Commons Licenses: | Recognition - No derivative works - Non commercial |
Preview |
PDF
- Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (2MB) | Preview |
La nanotecnología es el estudio que la mayoría de veces es tomada como una meta
tecnológica que nos ayuda en el área de investigación para tratar con la manipulación
y el control en forma precisa de la materia con dimensiones comprendidas entre 1 y
100 nanómetros. Recordando que el prefijo nano proviene del griego vavoc que
significa enano y corresponde a un factor de 10^-9, que aplicada a las unidades de
longitud corresponde a una mil millonésima parte de un metro. Ahora sabemos que
esta ciencia permite trabajar con estructuras moleculares y sus átomos, obteniendo
materiales que exhiben fenómenos físicos, químicos y biológicos, muy distintos a los
que manifiestan los materiales usados con una longitud mayor. Por ejemplo en
medicina, los compuestos manométricos y los materiales nano estructurados muchas
veces ofrecen una mayor eficacia con respecto a las formulaciones químicas
tradicionales, ya que muchas veces llegan a combinar los antiguos compuestos con
estos nuevos para crear nuevas terapias e inclusive han llegado a reemplazarlos,
revelando así nuevas propiedades diagnósticas y terapéuticas. A su vez, la complejidad
de la información a nivel nano es mucho mayor que en los niveles biológicos
convencionales y, por tanto, cualquier flujo de trabajo en nano medicina requiere, de
forma inherente, estrategias de gestión de información avanzadas.
Muchos investigadores en la nanotecnología están buscando la manera de obtener
información acerca de estos materiales nanométricos, para mejorar sus estudios que
muchas veces lleva a probar estos métodos o crear nuevos compuestos para ayudar a
la medicina actual, contra las enfermedades más poderosas como el cáncer. Pero en
estos días es muy difícil encontrar una herramienta que les brinde la información
específica que buscan en los miles de ensayos clínicos que se suben diariamente en la
web. Actualmente, la informática biomédica trata de proporcionar el marco de trabajo
que permita lidiar con estos retos de la información a nivel nano, en este contexto, la
nueva área de la nano informática pretende detectar y establecer los vínculos
existentes entre la medicina, la nanotecnología y la informática, fomentando así la
aplicación de métodos computacionales para resolver las cuestiones y problemas que
surgen con la información en la amplia intersección entre la biomedicina y la
nanotecnología.
Otro caso en la actualidad es que muchos investigadores de biomedicina desean saber
y comparar la información dentro de los ensayos clínicos que contiene temas de
nanotecnología en las diferentes paginas en la web por todo el mundo, obteniendo en
si ensayos clínicos que se han creado en Norte América, y ensayos clínicos que se han
creado en Europa, y saber si en este tiempo este campo realmente está siendo
explotado en los dos continentes. El problema es que no se ha creado una herramienta que estime un valor aproximado para saber los porcentajes del total de ensayos
clínicos que se han creado en estas páginas web.
En esta tesis de fin de máster, el autor utiliza un mejorado pre-procesamiento de texto
y un algoritmo que fue determinado como el mejor procesamiento de texto en una
tesis doctoral, que incluyo algunas pruebas con muchos de estos para obtener una
estimación cercana que ayudaba a diferenciar cuando un ensayo clínico contiene
información sobre nanotecnología y cuando no. En otras palabras aplicar un análisis de
la literatura científica y de los registros de ensayos clínicos disponibles en los dos
continentes para extraer información relevante sobre experimentos y resultados en
nano medicina (patrones textuales, vocabulario en común, descriptores de
experimentos, parámetros de caracterización, etc.), seguido el mecanismo de
procesamiento para estructurar y analizar dicha información automáticamente. Este
análisis concluye con la estimación antes mencionada necesaria para comparar la
cantidad de estudios sobre nanotecnología en estos dos continentes. Obviamente
usamos un modelo de datos de referencia (gold standard) —un conjunto de datos de
entrenamiento anotados manualmente—, y el conjunto de datos para el test es toda la
base de datos de estos registros de ensayos clínicos, permitiendo distinguir
automáticamente los estudios centrados en nano drogas, nano dispositivos y nano
métodos de aquellos enfocados a testear productos farmacéuticos tradicionales.---ABSTRACT---Nanotechnology is the scientific study that usually is seen as a technological goal that helps us
in the investigation field to deal with the manipulation and precise control of the matter with
dimensions that range from 1 to 100 nanometers. Remembering that the prefix nano comes
from the Greek word νᾶνος, meaning dwarf and denotes a factor of 10^-9, that applyied the
longitude units is equal to a billionth of a meter. Now we know that this science allows us to
work with molecular structures and their atoms, obtaining material that exhibit physical,
chemical and biological phenomena very different to those manifesting in materials with a
bigger longitude. As an example in medicine, the nanometric compounds and the materials in
nano structures are often offered with more effectiveness regarding to the traditional
chemical formulas. This is due to the fact that many occasions combining these old compounds
with the new ones, creates new therapies and even replaced them, reveling new diagnostic
and therapeutic properties. Even though the complexity of the information at nano level is
greater than that in conventional biologic level and, thus, any work flow in nano medicine
requires, in an inherent way, advance information management strategies.
Many researchers in nanotechnology are looking for a way to obtain information about these
nanometric materials to improve their studies that leads in many occasions to prove these
methods or to create a new compound that helps modern medicine against powerful diseases,
such as cancer. But in these days it is difficult to find a tool that searches and provides a
specific information in the thousands of clinic essays that are uploaded daily on the web.
Currently, the bio medic informatics tries to provide the work frame that will allow to deal with
these information challenge in nano level. In this context, the new area of nano informatics
pretends to detect and establish the existing links between medicine, nanotechnology and
informatics, encouraging the usage of computational methods to resolve questions and
problems that surge with the wide information intersection that is between biomedicine and
nanotechnology.
Another present case, is that many biomedicine researchers want to know and be able to
compare the information inside those clinic essays that contains subjects of nanotechnology
on the different webpages across the world, obtaining the clinic essays that has been done in
North America and the essays done in Europe, and thus knowing if in this time, this field is
really being exploited in both continents.
In this master thesis, the author will use an enhanced text pre-processor with an algorithm
that was defined as the best text processor in a doctoral thesis, that included many of these
tests to obtain a close estimation that helps to differentiate when a clinic essay contains
information about nanotechnology and when it does not. In other words, applying an analysis
to the scientific literature and clinic essay available in both continents, in order to extract
relevant information about experiments and the results in nano-medicine (textual patterns,
common vocabulary, experiments descriptors, characterization parameters, etc.), followed by
the mechanism process to structure and analyze said information automatically. This analysis
concludes with the estimation, mentioned before, needed to compare the quantity of studies
about nanotechnology in these two continents. Obviously we use a data reference model (Gold standard) – a set of training data manually annotated –, and the set of data for the test
conforms the entire database of these clinic essay registers, allowing to distinguish
automatically the studies centered on nano drugs, nano devices and nano methods of those
focus on testing traditional pharmaceutical products.
Item ID: | 37431 |
---|---|
DC Identifier: | https://oa.upm.es/37431/ |
OAI Identifier: | oai:oa.upm.es:37431 |
Deposited by: | Biblioteca Facultad de Informatica |
Deposited on: | 03 Sep 2015 08:25 |
Last Modified: | 03 Sep 2015 08:25 |