Generación de datos enlazados a partir de los indicadores anuales de revistas indexadas en Scopus

Morocho Yunga, Juan Carlos (2018). Generación de datos enlazados a partir de los indicadores anuales de revistas indexadas en Scopus. Thesis (Master thesis), E.T.S. de Ingenieros Informáticos (UPM).

Description

Title: Generación de datos enlazados a partir de los indicadores anuales de revistas indexadas en Scopus
Author/s:
  • Morocho Yunga, Juan Carlos
Contributor/s:
  • Gómez Pérez, Asunción
  • Suárez de Figueroa Baonza, María del Carmen
Item Type: Thesis (Master thesis)
Masters title: Inteligencia Artificial
Date: July 2018
Subjects:
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Inteligencia Artificial
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (4MB) | Preview

Abstract

El propósito de esta tesis de fin de master es aplicar el enfoque de datos enlazados a los indicadores de revistas indexadas, tomando como insumos los reportes anuales de los portales Scimago Journal Rank y CiteScore Metrics, estas fuentes de datos se generan a partir del contenido de la base de datos científica Scopus. Scopus indexa las publicaciones de alrededor de 18000 revistas científicas publicadas por más de 5000 editores internacionales. El proceso de publicación de datos se basa en un ciclo de vida compuesto por cinco actividades principales: especificación, modelado, generación de RDF, generación de enlaces externos, publicación y explotación. Para las actividades de especificación y modelado ontológico se aplicó la metodología NeOn, que a través de un conjunto de actividades y tareas específicas ha permitido el desarrollo de la red ontológica JournalMetrics. Luego, la red ontológica es instanciada a través de la generación de tripletas RDF y posteriormente se crean enlaces externos considerando otros conjuntos de datos relacionados. Como producto del desarrollo de esta investigación, se pueden mencionar tres hallazgos principales. Primero, el llevar a cabo el desarrollo ontológico guiado por la metodología Neon, que aporta guías y recomendaciones, permite controlar el desarrollo de procesos, actividades y tareas que conducen a la creación de ontologías en diferentes escenarios de acuerdo a la naturaleza del problema a resolver. Segundo, a través de tecnologías de datos enlazados es posible integrar o mapear datos provenientes de fuentes heterogéneas, de forma concreta en esta tesis de fin de máster, se utilizan dos reportes anuales de revistas indexadas, y a pesar de que provienen de la base de datos científica Scopus difieren en las métricas calculadas. Tercero, la incursión de tecnologías semánticas en casi todas las áreas de conocimiento permite vincular datos que antes permanecían aislados, esto impulsa las posibilidades de colaboración y la reutilización de conjuntos de datos que están en constante crecimiento en la nube de datos enlazados a nivel mundial. Una vez concluida la tesis de fin de máster, las lecciones aprendidas sugieren que los datos estadísticos, que en su mayoría son publicados en la Web, no permiten ser integrados y procesados de forma automática, pero al aplicarles tecnologías semánticas se pueden obtener en formatos estándar para ser compartidos y reutilizados en otras iniciativas o ámbitos de estudio. Finalmente, la principal contribución es la publicación de los datos de revistas indexadas Journal Metrics, dado que, hasta ahora se ha enfocado con más interés sobre las publicaciones científicas, por consiguiente, se convierte en una oportunidad de aportar en este ámbito.---ABSTRACT---The purpose of this Master’s Thesis is to apply the linked data approach to the indexed journal indicators, taking into account inputs from the annual reports of the Scimago Journal Rank and CiteScore Metrics website, these data sources are generated from the content of the scientific database Scopus. Scopus indexes the publications of around 18,000 scientific journals published by more than 5000 international publishers. The process of publishing data is based on a life cycle composed of five main activities: specification, modeling, generation of RDF, generation of external links, publication and exploitation. For the activities of specification and ontological modeling, the NeOn methodology is applied, which through a set of activities and specific tasks has allowed the development of the ontological network JournalMetrics. Then, the ontological network is instantiated through the generation of RDF triplets and subsequently external links are created considering other related data sets. As a result of the development of this research, three main findings can be mentioned. Firstly, carrying out the ontological development guided by the Neon Methodology, which provides guidelines and recommendations, allows controlling the development of processes, activities and tasks that lead to the creation of ontologies in different scenarios according to the nature of the problem to be solved. Second, through linked data technologies it is possible to integrate or map data from heterogeneous sources, more specifically in this Master's Thesis, two annual reports of indexed journals are used, and even though they come from the database Scientific Scopus differ in the calculated metrics. Third, the incursion of semantic technologies in almost all areas of knowledge allows linking data that previously remained isolated, it drives the possibilities of collaboration and the reuse of datasets that are constantly growing in the globally linked data cloud. Once the final Master's Thesis is finished, the lessons learnt suggest that statistical data, which are mostly published on the Web, do not allow for automatic integration and processing, but by applying semantic technologies they can be obtained in standard formats to be shared and reused in other initiatives or areas of study. Finally, the main contribution is the publication of data from journals indexed named JournalMetrics, because until now, it has focused more on scientific publications, therefore, it becomes an opportunity to contribute in this field

More information

Item ID: 51744
DC Identifier: http://oa.upm.es/51744/
OAI Identifier: oai:oa.upm.es:51744
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 24 Jul 2018 13:20
Last Modified: 24 Jul 2018 13:20
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM