Citation
Rodríguez Paños, Borja
(2017).
Comparativa de rendimiento entre algoritmos de machine learning sobre plataformas de procesamiento distribuido.
Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S. de Ingenieros Informáticos (UPM), Madrid, España.
Abstract
Este documento recoge el estudio realizado sobre el rendimiento de las herramientas que representan el presente y el futuro de la computación distribuida, clave en la era de la información.
El proyecto estudia el rendimiento sobre la utilización que hacen ambas plataformas de la principal herramienta de la que disponen, aquella hacia la que se dirigen en última instancia todas las demás funcionalidades desarrolladas: machine learning.
Machine learning o aprendizaje automático en las ciencias de la computación, es la rama de la Inteligencia Artificial que modela sistemas capaces de inferir patrones sobre conjuntos de datos con el fin de constituir predicciones.
Se han desarrollado para este proyecto un algoritmo de aprendizaje automático supervisado tal como una regresión lineal múltiple, así como un algoritmo de aprendizaje no supervisado, clusterización (K-means).---ABSTRACT---This paper presents the study of the performance of those tools which represent the present and future of distributed computation, key in the information age.
The project analyzes the performance over the use registered by both applications with the main tool they have, the one towards all other functionality are developed in ultimate instance: machine learning.
Machine learning in computer science is the field of Artificial Intelligent that creates models capable of inferring over large dataset with the objective of making predictions.
A machine learning supervised algorithm such as lineal regression, has been developed to this project as well as learning unsupervised algorithm as K-means clustering.