Desarrollo de una herramienta de análisis, procesado y visualización de fuentes de datos empleando técnicas de Big Data utilizando Apache Spark

Cacho Zurrunero, Raquel (2017). Desarrollo de una herramienta de análisis, procesado y visualización de fuentes de datos empleando técnicas de Big Data utilizando Apache Spark. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. Telecomunicación (UPM), Madrid.

Description

Title: Desarrollo de una herramienta de análisis, procesado y visualización de fuentes de datos empleando técnicas de Big Data utilizando Apache Spark
Author/s:
  • Cacho Zurrunero, Raquel
Contributor/s:
  • Sánchez de Rivera Córdoba, Diego
Item Type: Final Project
Degree: Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación
Date: 2017
Subjects:
Freetext Keywords: Big Data, Kafka, Spark, Cassandra, Qlikview
Faculty: E.T.S.I. Telecomunicación (UPM)
Department: Ingeniería de Sistemas Telemáticos [hasta 2014]
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB) | Preview

Abstract

El presente trabajo fin de grado abarca el estudio del conjunto de técnicas Big Data, que nos permiten el análisis, procesado y visualización de grandes cantidades datos. El objetivo es así una familiarización con el concepto de Big Data y todas las herramientas que lo engloban, para después proceder al montaje de una arquitectura en completo y finalizar con un ejemplo de uso con la herramienta Apache Spark como motor del procesamiento. Actualmente nos encontramos en la era de la información, la generación de datos es masiva, día a día se generan datos desde todo tipo de terminales. Es así como la sociedad actual, precisa de sistemas aptos a manejar tales cantidades de información. Por Big Data entendemos todo gran volumen de datos estructurados, semi-estructurados y no estructurados que tienen el potencial de obtener información útil de ellos. Es objetivo de este documento, exponer la situación actual de la explotación masiva de datos, desde sus orígenes hasta el día de hoy, así como un estudio en profundidad de las herramientas más empleadas actualmente. Se ha definido y desplegado una arquitectura Big Data completamente funcional, desde la recopilación de datos hasta la visualización de resultados, pasando por su almacenamiento, explotación y análisis. Finalmente, gracias a todo el conocimiento adquirido hasta entonces, se ha desarrollado un caso de uso práctico sobre la arquitectura anteriormente definida. Este caso de uso tendrá como motor de funcionamiento Apache Spark, que será el encargado de realizar la explotación, procesamiento y análisis de los datos.

More information

Item ID: 48624
DC Identifier: http://oa.upm.es/48624/
OAI Identifier: oai:oa.upm.es:48624
Deposited by: Biblioteca ETSI Telecomunicación
Deposited on: 29 Nov 2017 09:45
Last Modified: 29 Nov 2017 09:45
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM