Citation
Arrillaga González, María
(2017).
Diseño de técnicas de análisis y visualización para los
proyectos del itdUPM.
Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. Telecomunicación (UPM), Madrid.
Abstract
Este trabajo surge a partir de una iniciativa de colaboración promovida por el Centro de Innovación
en Tecnologías para el Desarrollo de la UPM (itdUPM) con el objetivo de explorar diferentes técnicas de análisis de datos e información que puedan ayudar a la organización de los proyectos que dicho centro realiza.
Concretamente se han identificado tres fuentes de datos sobre los que el centro itdUPM tiene mayor interés:
Memorias de los proyectos y actividades que realizan.
Bases de datos de direcciones de correo electrónico de las entidades y personas con las que colaboran.
Datos procedentes de sensores instalados en un edificio experimental del centro itdUPM vinculados a un proyecto de eficiencia ambiental.
Aun tratándose de datos de naturaleza diversa, se persigue el objetivo común de dotar a dichos datos de un valor añadido de manera que se optimice así la labor que se realiza en el itdUPM:
En el caso de las memorias y proyectos: analizar el contenido de las mismas para extraer entidades que han participado en ellas.
En la BBDD de los contactos: buscar una forma de analizar redes de contactos y facilitar la búsqueda de entidades y generación de listas de correo.
En los sensores: estudiar formas para mejorar la presentación visual de la información recogida por los mismos.
Cabe destacar que si bien hay un objetivo común también hay una disparidad en las tecnologías que pueden aplicarse, así en el análisis de las memorias se requieren técnicas de procesado de lenguaje natural (PLN), para el análisis de la BBDD de los contactos, es necesaria una mezcla de PLN con
técnicas de visualización de datos y en el caso de los sensores principalmente se requieren técnicas de visualización. Es por ello que se ha tratado de hacer una aproximación inicial buscando tecnologías que puedan aplicarse, en lo posible, a los tres tipos de datos previamente mencionados.
Para lograr este objetivo se ha realizado en primer lugar un estudio de las diferentes herramientas de análisis y visualización de datos disponibles actualmente en el mercado, considerando prioritariamente aquellas que proporcionan sus servicios de forma gratuita para organizaciones sin ánimo de lucro, ya que al tratarse del centro itdUPM este resulta requisito imprescindible, y
posteriormente se ha procedido a la elección y aplicación de dichas herramientas en los datos de partida.
En este documento se expone el proceso seguido para la obtención del resultado final. En la primera parte se introduce al lector en el contexto en el que se va a trabajar, incluyendo en esta introducción las necesidades que surgen por parte de la organización para la realización de este proyecto, así como el escenario de manejo de datos de naturaleza diversa que puede entenderse como parte de los
retos que hoy se engloban bajo la denominación Big Data. En una segunda parte del documento, una vez se han elegido las herramientas, se procede a explicar el desarrollo del proyecto dividiendo
el mismo en tres bloques, y por último se explican los resultados obtenidos y las conclusiones a las que se llegan con dichos resultados, así como las líneas futuras que puede seguir este trabajo.