Service of machine learning in streaming: supervised learning – decision tree

Atiencia Guamaní, Jorge Ramiro (2020). Service of machine learning in streaming: supervised learning – decision tree. Thesis (Master thesis), E.T.S. de Ingenieros Informáticos (UPM).

Description

Title: Service of machine learning in streaming: supervised learning – decision tree
Author/s:
  • Atiencia Guamaní, Jorge Ramiro
Contributor/s:
  • Segovia Pérez, Francisco Javier
Item Type: Thesis (Master thesis)
Masters title: Software y Sistemas
Date: July 2020
Subjects:
Freetext Keywords: Real-time prediction; Machine learning as a service; Decision tree; API REST
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Lenguajes y Sistemas Informáticos e Ingeniería del Software
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (8MB) | Preview

Abstract

Hoy en día, los datos son el bien intangible más valioso para las empresas y organizaciones, debido a, que sobre ellos apoyan la toma de sus decisiones, mismas decisiones que son el factor diferenciador con respecto a su competencia o mantenerse a la vanguardia en el mercado, es por ello, que de la capacidad de explotación de estos datos dependerá la calidad y valía de la información que se pueda obtener, por consiguiente, aplicar técnicas de machine learning sobre los datos, permitirán generar modelos que ayuden a dichas empresas y organizaciones a predecir el comportamiento de su negocio. Por otra parte debido al actual y creciente volumen de información que generan el conjunto de dispositivos, sistemas y aplicaciones que se pueden interconectar (Big Data), la capacidad de cómputo de toda esa información se vuelve un verdadero desafío, y si, a eso le añadimos la premisa de que dichas empresas y organizaciones requieren tomar sus decisiones en el menor tiempo posible, está cada vez más latente la demanda de procesar esa gran cantidad de información en tiempo real (Streaming). Finalmente, el uso cada vez mayor de internet y el cloud computing originan que las arquitecturas orientadas a servicios tengan una mayor adopción para implementar los sistemas, debido a su capacidad de desacoplamiento y escalabilidad, así como la facilidad de integración entre sistemas con arquitecturas heterogéneas. Son estos aspectos, lo que motivan este trabajo de fin de master, que propone el desarrollo y despliegue de una API REST de machine learning de aprendizaje supervisado, basado en árboles de decisión, que permita entrenar un modelo predictivo sobre un específico dominio de datos, y tenga la capacidad de predecir sobre nuevos datos del mismo dominio en tiempo real. Esta API REST pretende impulsar el desarrollo de nuevas aplicaciones inteligentes para empresas, organizaciones e incluso usuarios finales, facilitando el procesamiento, el análisis de grandes volúmenes de información y la integración con sistemas externos. También busca impulsar el machine learning hacia el paradigma de los servicios.---ABSTRACT---Today, data is the most valuable intangible asset for companies and organizations, due to the fact that they support decision-making on them, the same decisions that are the differentiating factor with respect to their competition or staying ahead in the market, that is why the quality and value of information that can be obtained will depend on the capacity to exploit this data, therefore applying machine learning techniques to the data will allow the generation of models that help these companies and organizations to predict the behaviour of your business. On the other hand, due to the current and growing volume of information generated by the set of devices, systems and applications that can be interconnected (Big Data), the computing capacity of all that information becomes a real challenge, and if, we add the premise that these companies and organization need to make their decisions in the shortest possible time, the demand to process this large amount of information in real time (Streaming) is increasingly latent. Finally, the increasing use of the internet and cloud computing mean that service-oriented architectures have a greater adoption to implement systems, due to their decoupling capacity and scalability, as well as the ease of integration between systems with heterogeneous architectures. It is these aspects that motivate this master’s thesis, which proposes the development and deployment of a supervised learning machine learning REST API, based on decision trees, that allows training a predictive model on a specific data domain, and have the ability to predict new data from the same domain in real time. This REST API aims to drive the development of new smart applications for companies, organizations and even end users, facilitating the processing, the analysis of large volumes of information and integration with external systems. It also seeks to push machine learning towards the services paradigm.

More information

Item ID: 63090
DC Identifier: http://oa.upm.es/63090/
OAI Identifier: oai:oa.upm.es:63090
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 24 Jul 2020 10:49
Last Modified: 24 Jul 2020 10:49
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM