Aplicación de árboles de decisión a la previsión y estudio de importancia de variables de la serie del número de pasajeros en el aeropuerto Adolfo Suárez Madrid-Barajas

Palús Acín, Antonio Octavio (2016). Aplicación de árboles de decisión a la previsión y estudio de importancia de variables de la serie del número de pasajeros en el aeropuerto Adolfo Suárez Madrid-Barajas. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. Industriales (UPM).

Descripción

Título: Aplicación de árboles de decisión a la previsión y estudio de importancia de variables de la serie del número de pasajeros en el aeropuerto Adolfo Suárez Madrid-Barajas
Autor/es:
  • Palús Acín, Antonio Octavio
Director/es:
  • Mira McWilliams, Jose Manuel
Tipo de Documento: Proyecto Fin de Carrera/Grado
Grado: Grado en Ingeniería de Organización
Fecha: Septiembre 2016
Materias:
Palabras Clave Informales: Akaike, minería de datos, CART, Bagging, Random Forest, aeropuerto Adolfo Suárez Madrid-Barajas, pasajeros.
Escuela: E.T.S.I. Industriales (UPM)
Departamento: Ingeniería de Organización, Administración de Empresas y Estadística
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
Pdf - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (4MB) | Vista Previa

Resumen

El Aeropuerto Adolfo Suárez Madrid-Barajas supone alrededor del 25% del tráfico total de pasajeros en España y más de la mitad del transporte aéreo de carga. En términos internacionales, es el quinto aeropuerto europeo en volumen de pasajeros, situándose por detrás de Heathrow, Charles de Gaulle, Frankfurt y Amsterdam Schipol. Una vez ubicado el aeropuerto en el ámbito nacional e internacional, es imprescindible cuantificar en términos económicos el impacto de la infraestructura aeroportuaria en el ámbito regional y nacional. De acuerdo a estimaciones del Barómetro Económico de la ciudad de Madrid (2013), el Aeropuerto Adolfo Suárez Madrid-Barajas, el impacto económico del aeropuerto durante el año 2012 ascendió a más de 1,900 millones de euros y un VAB (valor añadido bruto) de las actividades indirectas superiores a los 377 M€, mientras que a escala nacional, induce un VAB indirecto fue superior a los 2,800M€. En cuanto al volumen de empleo que genera el aeropuerto, se estima que el número de empleos directos e indirectos generados en Madrid ascendió en el año 2012 a casi 39,000 empleos, mientras que en el resto de España superó la cifra de 46,000 puestos de trabajo. Las anteriores cifras son la principal motivación en la realización del presente proyecto, ya que la aplicación de técnicas de minería de datos a la investigación de las variables que impactan en el tráfico aeroportuario y su aplicación a la predicción del tráfico suponen una novedosa aplicación en el ámbito aeroportuario español. La minería de datos proporciona frente a otras técnicas tradicionales, claras ventajas ya que permiten el manejo de grandes volúmenes de datos y tal y como se puede comprobar a lo largo del presente proyecto, los resultados de los modelos y predicciones utilizados tienen altos porcentajes en cuanto a variabilidad explicada –gracias a la utilización de modelos Random Forest- y bajos volúmenes de error, respectivamente. En el presente proyecto se han confeccionado ocho escenarios en función de las variables dependientes analizadas, a saber: número total de pasajeros, número de pasajeros internacionales, número de pasajeros internacionales con origen o destino países de la Unión Europea y por último, número de pasajeros internacionales con origen o destino países externos a la UE. Posteriormente, para cada uno de los modelos, se han confeccionado dos escenarios, el primero de ellos sin discriminación previa de variables y el segundo, con selección previa mediante el Criterio Akaike (AIC, Akaike Information Criterion). En definitiva, se han analizado un total de 16 modelos distintos. Adicionalmente, a la hora de realizar las predicciones, cada uno de los modelos se ha sometido a tres análisis diferentes (Random Forest, CART y Bagging), con lo que el número total de variantes estudiadas asciende a 48. El volumen de escenarios analizados ha permitido concluir lo que otros análisis económicos y sociales han realizado con anterioridad, por ejemplo, el alto grado de dependencia que las variables turísticas –medido como grado de importancia de las variables independientes en Random Forest- tienen sobre la infraestructura madrileña. Asimismo, especial consideración merecen en cuanto a términos cualitativos, diferentes variables financieras, poblaciones e industriales, ya no sólo de España, sino de los principales países europeos analizados en el presente estudio. A modo de ejemplo es importante señalar –en cuanto a importancia de variables independientes a la hora de analizar las variables dependientes de número de pasajeros- el alto grado de importancia que han tenido –en diferentes modelos analizados variables tales como la evolución retardada de la tasa de desempleo en los Países Bajos, la evolución del índice de producción industrial en el Reino Unido, el índice de ventas del sector retail portugués o la evolución retardada 6 meses de la tasa de cambio euro-dólar. Es por ello que la aplicación de las diferentes metodologías de minería de datos como sistema que sustente la toma de decisiones puede convertirse en una poderosa herramienta para los gestores aeroportuarios, operadores aeronáuticos y turísticos. Sirva como ejemplo, la ayuda que puede suponer la implementación de la herramienta a la hora de analizar los posibles impactos en las cuentas de resultados –en forma de volumen de ingresos o rentabilidad- de las compañías, motivados por el devenir de los ciclos económicos o por puntales decisiones políticas –tales como el probable impacto en la economía británica y europea de la decisión que supone la salida del mercado común europeo-. En cuanto a la calidad de las predicciones realizadas, destacar que los errores medios tienen un alto grado de aceptabilidad, ya que en algunos casos, como por ejemplo a la hora de analizar el tráfico total para el año 2015, se han situado alrededor del 8,69%. Por último, es importante recalcar las limitaciones en cuanto a accesibilidad a la información de diferentes variables que pudieran ser críticas a la hora de analizar la evolución del número de pasajeros, además de las limitaciones temporales en las que se circunscribe el proyecto. A pesar de ello, puede considerarse el presente proyecto como un punto de partida para futuras líneas de investigación.

Más información

ID de Registro: 43963
Identificador DC: http://oa.upm.es/43963/
Identificador OAI: oai:oa.upm.es:43963
Depositado por: Biblioteca ETSI Industriales
Depositado el: 25 Nov 2016 08:16
Ultima Modificación: 25 Nov 2016 08:16
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • e-ciencia
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM