Procesos ETL e implementación real enfocada al procesamiento de artículos científicos

Piña Martinez, Carlos (2018). Procesos ETL e implementación real enfocada al procesamiento de artículos científicos. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. de Sistemas Informáticos (UPM), Madrid.

Description

Title: Procesos ETL e implementación real enfocada al procesamiento de artículos científicos
Author/s:
  • Piña Martinez, Carlos
Contributor/s:
  • Gutiérrez Rodríguez, Abraham
Item Type: Final Project
Degree: Grado en Ingeniería de Computadores
Date: September 2018
Subjects:
Freetext Keywords: Procesos ETL
Faculty: E.T.S.I. de Sistemas Informáticos (UPM)
Department: Sistemas Informáticos
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img] PDF - Users in campus UPM only - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB)
[img] Archive (ZIP) (Anexos) - Users in campus UPM only
Download (40MB)

Abstract

El uso de procesos ETL está siendo cada vez más empleado dadas las exigencias actuales de las empresas con el fin de realizar modelos de predicción cada vez más precisos y complejos. Estos procesos requieren de la extracción de la información de diferentes fuentes de datos, invariablemente del tipo de documento (vídeo, audio, texto) que proporcionen. En este caso, a nivel educativo, se propone en la presente memoria, la creación de un proceso ETL responsable de procesar artículos científicos almacenados en ficheros de texto sin un formato estructurado mediante el uso de expresiones regulares para su posterior inserción en una base de datos y, finalmente, explotación de la información. Abstract: Nowadays, the use of ETL processes is being more frequently used due to the demands of most companies to elaborate more complex and precise prediction models. Those processes require to extract the information from many different data sources regardless the document type (video, audio, text,...) which provide. In this case, at a educational level, it is purposed in the current work, the making of an ETL process in charge of processing papers stored in files without any structured format. In order to perform this task, regular expressions are used and then, they are inserted into a database to, finally, take advantage of the information.

More information

Item ID: 54563
DC Identifier: http://oa.upm.es/54563/
OAI Identifier: oai:oa.upm.es:54563
Deposited by: Biblioteca Universitaria Campus Sur
Deposited on: 26 Apr 2019 05:24
Last Modified: 26 Apr 2019 05:25
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM