Aplicación de machine learning al modelado de funcionamiento de concesionarios de automóviles

Eusebio Hernández, Javier de (2019). Aplicación de machine learning al modelado de funcionamiento de concesionarios de automóviles. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. Industriales (UPM).

Description

Title: Aplicación de machine learning al modelado de funcionamiento de concesionarios de automóviles
Author/s:
  • Eusebio Hernández, Javier de
Contributor/s:
  • Mira McWilliams, José Manuel
Item Type: Final Project
Degree: Grado en Ingeniería en Tecnologías Industriales
Date: 2019
Subjects:
Faculty: E.T.S.I. Industriales (UPM)
Department: Ingeniería de Organización, Administración de Empresas y Estadística
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (2MB) | Preview

Abstract

En las últimas décadas, el desarrollo tecnológico y la necesidad de mejorar la productividad en el entorno empresarial han impulsado a las organizaciones a investigar y acumular grandes volúmenes de datos de todo tipo. A raíz de esta tendencia, se han podido identificar nuevos problemas e incluso dar solución a otros sin resolver. Lo que ha provocado la formación de un negocio entorno al mundo del “dato”. Esto es lo que se conoce actualmente como Big Data. Una vez almacenados todos estos datos, se busca extraer y analizar toda la información posible de ellos (tendencias, relaciones, variabilidad…) a través de las herramientas que proporciona la rama de la estadística centrada en esta función, el Machine Learning. La empresa de automóviles PREMIUM, con la cual se desarrolla este proyecto y que prefiere no ser mencionada, ha hecho de la captación y análisis de datos una realidad en su día a día. Un ejemplo de este uso es la evaluación de su red de 59 concesionarios en toda España, la cual se realiza según 38 variables de diferentes campos (facturaciones, cuotas de mercado, satisfacción de cliente o número de vehículos adquiridos) y departamentos (servicios, repuestos, vehículos nuevos o vehículos usados). En este proyecto, como objetivo final, se pretende dar a conocer las relaciones existentes entre dichas 38 variables mediante los datos adquiridos durante el período de actividad de 2017. Con la ayuda de los resultados obtenidos por aplicación de las técnicas, se busca confirmar o desmentir creencias de vínculos entre variables ya conocidos por la marca y especialmente descubrir relaciones que a priori se desconocen. Para alcanzar este objetivo, este trabajo realiza un estudio acerca de las herramientas de Machine Learning no supervisado. Dicha investigación se centra en los diferentes métodos de clustering para su posterior aplicación sobre la base de datos del caso de la empresa en cuestión. De esta forma, se muestra una utilidad poco habitual del clustering, que tradicionalmente se aplica sobre las observaciones y no sobre las variables. Además, para desarrollar esta función se ha utilizado el software R-Studio, herramienta dedicada a la computación estadística, la cual ha permitido representar e interpretar los resultados con gran fiabilidad mediante los dendrogramas (árboles de agrupaciones). De la aplicación de tres métodos diferentes, se han obtenido unos resultados de los cuales se han podido extraer varios puntos en común. Dichas similitudes sumadas a la información adicional de cada técnica han dibujado una solución robusta para el caso práctico (con la ayuda de la experiencia previa del profesional de la marca, el cual es codirector del trabajo). Esta solución no solo engloba varios clusters muy homogéneos, sino que también tiene en cuenta otras relaciones que, aunque sean más débiles, siguen siendo apreciables y relevantes para un análisis completo. Estos clusters robustos reflejan información acerca de los concesionarios en cuanto a: 1) Dimensión 2) Situación financiera 3) Cuota de mercado total 4) Beneficio total 5) Beneficio directo del departamento de Servicios. De forma que se alcanza una reducción final de la dimensión del problema de 38 a 27 variables. La aplicación de la metodología cluster sobre este caso práctico, no solo ha permitido sacar una conclusión para la marca, sino también extrapolar cierta información adaptable a cualquier tipo de clustering. Principalmente, se destaca la necesidad de utilizar varios métodos para conformar una solución robusta, y el preferible uso de la correlación como medida de similitud en clustering de variables. De esta forma se consigue un conocimiento profundo sobre cómo son las relaciones entre clusters.

More information

Item ID: 57271
DC Identifier: http://oa.upm.es/57271/
OAI Identifier: oai:oa.upm.es:57271
Deposited by: Biblioteca ETSI Industriales
Deposited on: 14 Nov 2019 07:15
Last Modified: 13 Jan 2020 23:30
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM