Estudio de alternativas de almacenamiento en proyectos de análisis predictivo

Rodríguez Sevilla, Carlos (2018). Estudio de alternativas de almacenamiento en proyectos de análisis predictivo. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. de Sistemas Informáticos (UPM), Madrid.

Description

Title: Estudio de alternativas de almacenamiento en proyectos de análisis predictivo
Author/s:
  • Rodríguez Sevilla, Carlos
Contributor/s:
  • Alarcón Cavero, Pedro Pablo
Item Type: Final Project
Degree: Grado en Ingeniería de Computadores
Date: 2018
Subjects:
Freetext Keywords: Almacenamiento PostgreSQL MongoDB R Análisis predictivo Aprendizaje automático Support Vector Machines Random Forests AdaBoost Storage Predictive analysis Machine learning
Faculty: E.T.S.I. de Sistemas Informáticos (UPM)
Department: Sistemas Informáticos
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img] PDF - Users in campus UPM only - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB)
[img] Archive (ZIP) (Anexos) - Users in campus UPM only
Download (6MB)

Abstract

Con este trabajo trataremos de contextualizar las diferencias entre los posibles métodos de almacenamiento de un proyecto de análisis predictivo. Para ello el método seguido incluye el desarrollo en R de un proyecto genérico de análisis predictivo que se utilizará como base para estudiar las consecuencias de la elección del método de almacenamiento. Como opciones se han elegido tres sistemas representando los paradigmas de almacenamiento más comunes que encontramos en la actualidad: PostgreSQL por cuenta de los sistemas relacionales de consultadas basadas en SQL; MongoDB como muestra de los sistemas no relacionales (NoSQL) y finalmente ficheros RDS (propios del lenguaje R) como ejemplo de almacenamiento en archivos. Leeremos los tiempos de ejecución que necesiten los diferentes sistemas y confrontaremos sus resultados en el largo plazo para ofrecer al lector un análisis de los resultados tan preciso como sea posible. Abstract: The main purpose of this work is to put in context the differences between the possible storage choices for a predictive analisys project. The method used for this cause includes the development of a generic predictive analisys project, written in R. The generic project will serve as a basis for studying the performance of the most common paradigns of storage nowadays, this are: PostgreSQL on behalf of relational database systems for SQL bases queries; MongoDB representing non-relational (NoSQL) systems and, finally, RDS files (resulting form the main method of serialization for this language) in representation of archive storing systems. The run time needed by each of the systems will be read and their long term performances will be confronted in order to provide a set of final results as accurate as posible.

More information

Item ID: 50532
DC Identifier: http://oa.upm.es/50532/
OAI Identifier: oai:oa.upm.es:50532
Deposited by: Biblioteca Universitaria Campus Sur
Deposited on: 27 Apr 2018 07:30
Last Modified: 27 Apr 2018 07:30
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM