Análisis crosmodal de un corpus científico

Ortega González, Raúl (2017). Análisis crosmodal de un corpus científico. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S. de Ingenieros Informáticos (UPM), Madrid, España.

Description

Title: Análisis crosmodal de un corpus científico
Author/s:
  • Ortega González, Raúl
Contributor/s:
Item Type: Final Project
Degree: Grado en Ingeniería Informática
Date: June 2017
Subjects:
Freetext Keywords: Publicaciones; Extracción automática de conocimiento; Modalidades; Categorización; Enfoque híbrido crosmodal; Research papers; Automatic knowledge extraction; Modalities; Convolutional neural network; Categorization; Hybrid crossmodal approach
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Inteligencia Artificial
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[thumbnail of TFG_RAUL_ORTEGA_GONZALEZ.pdf]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB) | Preview

Abstract

Uno de los retos más importantes en las investigaciones científicas
actuales es la representación del conocimiento que albergan
sus
publicaciones, de
manera que se convierta en
información procesable.
La
extracción automática de
conocimiento
supone en este aspecto un avance, ya que otorga la capacidad de
representar conceptos complejos de una
gran
cantidad de artículos.
Estos conceptos, a
su vez,
pueden encontrar
se
representados
de
diferentes
formas
(texto, imágenes,
diagramas, gráficas, mapas,
etc.),
lo
que
convierte
esta
extracción de conocimiento en
una tarea mucho más compleja, pero también más rica.
Es por ello
por lo que, en la
actualidad, e
xisten
diferentes modelos
capaces
de
extraer
conocimiento
para
cada una
de estas
representaciones, pero
hay
un déficit de
procedimientos
que encaren esta tarea
de forma
conjunta.
Bajo esta premisa, en este trabajo se tratará de evaluar la
extracción
de
conocimiento de un corpus
científico,
teniendo en cuenta
las
posibles
modalidades
en
las que se
puede
enco
ntrar (figuras y texto).
Para ello, se llevarán a cabo una serie de
tareas de categorización de artículos científicos alojados tanto en Semantic Scholar
como en Scigraph, basándose en la
rama
de conocimiento
a la que pertenecen,
mediante
un enfoque híbrido
crosmodal
y buscando mejorar aquellos modelos que ofrecen peores
resultados
basándose en una única modalidad. ---ABSTRACT---One
of the most important challenges in the research field today
is the
representation of papers’ knowledge, so
that
it becomes in
processa
ble information.
Automatic knowledge
extraction
is a breakthrough at this point, as it grants the ability of
portraying complex concepts from a huge amount of papers. At the same time, these
concepts may be
represented
throughout different
ways
(text, images, diagrams, graphs,
maps, etc.), which turns
this knowledge extraction task into a much more complex labor,
but also a much richer one too. Because of that, nowadays
there is
a large list of models
for extracting
features
from
each of these
representations, but there is a shortage of
procedures that can address this problem
jointly.
Under this premise, this project will try
to size up the abstraction of knowledge from a corpus of papers,
considering the possible
modalities in which it can be found (figures
and text). For this purpose, some
categorization tasks of research papers hosted in both Semantic Scholar and Scigraph
will be carried out, based on the branch of knowledge to which they belong, by using
a
hybrid
crossmodal
approach
and looking for improve
ments in those models that offer the
worst results
based on a single modality.

More information

Item ID: 52725
DC Identifier: https://oa.upm.es/52725/
OAI Identifier: oai:oa.upm.es:52725
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 22 Oct 2018 11:46
Last Modified: 22 Oct 2018 11:46
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM