Análisis comparativo de bases de datos relacionales y no relacionales

Rojas Gonzales, José Miguel (2017). Análisis comparativo de bases de datos relacionales y no relacionales. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. de Sistemas Informáticos (UPM), Madrid.

Description

Title: Análisis comparativo de bases de datos relacionales y no relacionales
Author/s:
  • Rojas Gonzales, José Miguel
Contributor/s:
  • Moldes Teo, Francisco Javier
Item Type: Final Project
Degree: Grado en Ingeniería del Software
Date: July 2017
Subjects:
Faculty: E.T.S.I. de Sistemas Informáticos (UPM)
Department: Sistemas Informáticos
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[thumbnail of TFG_JOSE_MIGUEL_ROJAS_GONZALES.pdf]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (4MB) | Preview

Abstract

RESUMEN

Los sistemas de gestión de bases de datos relacionales han sido la tecnología predominante para almacenar datos estructurados en aplicaciones web y de negocio. Estos son ampliamente conocidos como bases de datos SQL. Sin embargo, en los últimos años, las bases de datos no relacionales han aumentado drásticamente en popularidad. Estas bases de datos se conocen comúnmente como bases de datos NoSQL, las cuáles son claramente diferentes a las bases de datos SQL.
Con el aumento de la accesibilidad de Internet y la disponibilidad de almacenamiento barato, una gran cantidad de datos estructurados, semiestructurados y no estructurados son capturados y almacenados para diversas aplicaciones. Estos datos se denominan comúnmente Big Data. El procesamiento de esta gran cantidad de datos requiere esquemas de velocidad, que sean flexibles y distribuidos. Debido a las limitaciones que tienen las bases de datos relacionales, en muchos casos las bases de datos NoSQL se han convertido en las bases de datos preferidas para satisfacer estos requisitos.
El gran número de bases de datos NoSQL que hay en la actualidad conduce al cliente a un montón de preguntas sobre las diferencias entre cada una de ellas y si cumplen con los requisitos que este necesita para el almacenamiento de sus datos.
El objetivo de este trabajo de fin de grado es realizar un estudio de dos de las principales bases de datos NoSQL, MongoDB y Cassandra y comparar el rendimiento y el funcionamiento de estas con dos de las bases de datos SQL más utilizadas en la actualidad, Oracle Database y MySQL.
Para ello se analizará la arquitectura, el modelo de almacenamiento, las operaciones que se realizan en estas bases de datos, para determinar qué beneficios o soluciones aporta cuando se decide utilizar alguna de estas bases de datos para almacenar nuestros datos.
Se realizará un caso de pruebas en el que se comparará el rendimiento de las cuatro bases de datos dependiendo de los tipos de datos que se quiere almacenar y la forma en la que se representarán. Todas estas pruebas se realizarán en un Sistema Ubuntu y se utilizará el compilador Eclipse para realizar la medición de las queries.

ABSTRACT

Relational database management systems have been the predominant technology to store structured data in web and business applications. These are widely known as SQL databases. However, in recent years, non-relational databases have risen dramatically in popularity. These databases are commonly referred to as NoSQL databases, which are clearly different from SQL databases.
With the increase in Internet accessibility and the availability of cheap storage, a lot of structured, semi-structured and unstructured data is captured and stored for many applications. These data are commonly referred to as Big Data. Processing this large amount of data requires speed schemes, which are flexible and distributed. Due to the limitations of relational databases, in many cases NoSQL databases have become the preferred databases to meet these requirements.
The large number of NoSQL databases that currently exist leads the customer to a lot of questions about the differences between each of them and if they meet the requirements that this needs for the storage of their data.
The goal of this end-of-degree paper is to conduct a study of two of the most important NoSQL databases, MongoDB and Cassandra and compare their performance and function with two of the most commonly used SQL databases, Oracle Database and MySQL.
For that reason, the architecture, the storage model and the operations in these databases will be analyzed to determine what benefits or solutions they provide when deciding to use one of these databases to store our data.
A test case will be performed to compare the performance of the four databases depending on the types of data to be stored and the way in which they will be represented. All these tests will be performed on an Ubuntu System and the Eclipse compiler will be used to perform the queries measurement.

More information

Item ID: 48941
DC Identifier: https://oa.upm.es/48941/
OAI Identifier: oai:oa.upm.es:48941
Deposited by: Biblioteca Universitaria Campus Sur
Deposited on: 29 Dec 2017 07:43
Last Modified: 29 Dec 2017 07:43
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM