Generación de datos enlazados a partir de los indicadores anuales de revistas indexadas en Scopus

Morocho Yunga, Juan Carlos (2018). Generación de datos enlazados a partir de los indicadores anuales de revistas indexadas en Scopus. Tesis (Master), E.T.S. de Ingenieros Informáticos (UPM).

Descripción

Título: Generación de datos enlazados a partir de los indicadores anuales de revistas indexadas en Scopus
Autor/es:
  • Morocho Yunga, Juan Carlos
Director/es:
  • Gómez Pérez, Asunción
  • Suárez de Figueroa Baonza, María del Carmen
Tipo de Documento: Tesis (Master)
Título del máster: Inteligencia Artificial
Fecha: Julio 2018
Materias:
Escuela: E.T.S. de Ingenieros Informáticos (UPM)
Departamento: Inteligencia Artificial
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
PDF (Document Portable Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (4MB) | Vista Previa

Resumen

El propósito de esta tesis de fin de master es aplicar el enfoque de datos enlazados a los indicadores de revistas indexadas, tomando como insumos los reportes anuales de los portales Scimago Journal Rank y CiteScore Metrics, estas fuentes de datos se generan a partir del contenido de la base de datos científica Scopus. Scopus indexa las publicaciones de alrededor de 18000 revistas científicas publicadas por más de 5000 editores internacionales. El proceso de publicación de datos se basa en un ciclo de vida compuesto por cinco actividades principales: especificación, modelado, generación de RDF, generación de enlaces externos, publicación y explotación. Para las actividades de especificación y modelado ontológico se aplicó la metodología NeOn, que a través de un conjunto de actividades y tareas específicas ha permitido el desarrollo de la red ontológica JournalMetrics. Luego, la red ontológica es instanciada a través de la generación de tripletas RDF y posteriormente se crean enlaces externos considerando otros conjuntos de datos relacionados. Como producto del desarrollo de esta investigación, se pueden mencionar tres hallazgos principales. Primero, el llevar a cabo el desarrollo ontológico guiado por la metodología Neon, que aporta guías y recomendaciones, permite controlar el desarrollo de procesos, actividades y tareas que conducen a la creación de ontologías en diferentes escenarios de acuerdo a la naturaleza del problema a resolver. Segundo, a través de tecnologías de datos enlazados es posible integrar o mapear datos provenientes de fuentes heterogéneas, de forma concreta en esta tesis de fin de máster, se utilizan dos reportes anuales de revistas indexadas, y a pesar de que provienen de la base de datos científica Scopus difieren en las métricas calculadas. Tercero, la incursión de tecnologías semánticas en casi todas las áreas de conocimiento permite vincular datos que antes permanecían aislados, esto impulsa las posibilidades de colaboración y la reutilización de conjuntos de datos que están en constante crecimiento en la nube de datos enlazados a nivel mundial. Una vez concluida la tesis de fin de máster, las lecciones aprendidas sugieren que los datos estadísticos, que en su mayoría son publicados en la Web, no permiten ser integrados y procesados de forma automática, pero al aplicarles tecnologías semánticas se pueden obtener en formatos estándar para ser compartidos y reutilizados en otras iniciativas o ámbitos de estudio. Finalmente, la principal contribución es la publicación de los datos de revistas indexadas Journal Metrics, dado que, hasta ahora se ha enfocado con más interés sobre las publicaciones científicas, por consiguiente, se convierte en una oportunidad de aportar en este ámbito.---ABSTRACT---The purpose of this Master’s Thesis is to apply the linked data approach to the indexed journal indicators, taking into account inputs from the annual reports of the Scimago Journal Rank and CiteScore Metrics website, these data sources are generated from the content of the scientific database Scopus. Scopus indexes the publications of around 18,000 scientific journals published by more than 5000 international publishers. The process of publishing data is based on a life cycle composed of five main activities: specification, modeling, generation of RDF, generation of external links, publication and exploitation. For the activities of specification and ontological modeling, the NeOn methodology is applied, which through a set of activities and specific tasks has allowed the development of the ontological network JournalMetrics. Then, the ontological network is instantiated through the generation of RDF triplets and subsequently external links are created considering other related data sets. As a result of the development of this research, three main findings can be mentioned. Firstly, carrying out the ontological development guided by the Neon Methodology, which provides guidelines and recommendations, allows controlling the development of processes, activities and tasks that lead to the creation of ontologies in different scenarios according to the nature of the problem to be solved. Second, through linked data technologies it is possible to integrate or map data from heterogeneous sources, more specifically in this Master's Thesis, two annual reports of indexed journals are used, and even though they come from the database Scientific Scopus differ in the calculated metrics. Third, the incursion of semantic technologies in almost all areas of knowledge allows linking data that previously remained isolated, it drives the possibilities of collaboration and the reuse of datasets that are constantly growing in the globally linked data cloud. Once the final Master's Thesis is finished, the lessons learnt suggest that statistical data, which are mostly published on the Web, do not allow for automatic integration and processing, but by applying semantic technologies they can be obtained in standard formats to be shared and reused in other initiatives or areas of study. Finally, the main contribution is the publication of data from journals indexed named JournalMetrics, because until now, it has focused more on scientific publications, therefore, it becomes an opportunity to contribute in this field

Más información

ID de Registro: 51744
Identificador DC: http://oa.upm.es/51744/
Identificador OAI: oai:oa.upm.es:51744
Depositado por: Biblioteca Facultad de Informatica
Depositado el: 24 Jul 2018 13:20
Ultima Modificación: 24 Jul 2018 13:20
  • GEO_UP4
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • InvestigaM
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM