Abstract
Los dispositivos móviles y las opiniones de los usuarios cada vez juegan un papel más importante en el mundo de la tecnología. Las plataformas de aplicaciones móviles recogen grandes cantidades de datos de opiniones de usuarios sin analizarlos automáticamente. Creemos en el gran potencial de esos datos y hemos creado una herramienta de clasificación automática de reseñas de usuarios en aplicaciones móviles con el fin de ofrecer a futuros investigadores una forma de extraer información de estos datos. Esta memoria recoge el proyecto de construcción del un clasificador de texto utilizando aprendizaje automático y técnicas de procesamiento de lenguaje natural para una clasificación supervisada. En ella se detalla el funcionamiento del clasificador y todas las opciones disponibles para el investigador. El clasificador realiza preprocesamiento del texto y extracción de características y compara varios métodos de aprendizaje automático en la clasificación mostrando sus puntuaciones y resultados. Una parte de los datos introducidos a la herramienta deben estar clasificados para entrenar los algoritmos y así poder analizar el resto de las reseñas. Después, el investigador elegirá entre las opciones de preprocesamiento de texto y extracción de características que se ofrecen. Entre ellas están la tokenización, lematización y stemming del texto e inclusión de las puntuationes de las reseñas para la clasificación. Finalmente la herramienta clasificará automáticamente los datos sin etiquetar y mostrará una comparación de los algoritmos disponibles. También ofrece la posibilidad de añadir otros algoritmos de clasificación o ’plugins’ que se utilizarán igual que los disponibles por defecto. El proyecto global de la creación de la herramienta fue realizado por tres alumnos de Computer Science en la Vrije Universiteit de Amsterdam. Esta parte en concreto se centra en el código de la herramienta (back-end). Las otras dos partes consistían en la creación de una interfaz gráfica para la misma (front-end) y un caso práctico utilizándola para una investigación real respectivamente. Otro de los objetivos de este subproyecto es hacer la herramienta lo más extensible y flexible posible para facilitar su futuro uso a personas que no son expertas en la materia y coordinar objetivos con el subproyecto de la interfaz gráfica.---ABSTRACT---The importance of portable devices and apps is exponentially increasing. Users are a key part of this commerce expressing their opinions in app reviews, which are important for developers. We believe in the potential of this large amount data and its utility for further studies in any field. For this purpose, we created an automatic reviews classifier. This paper embraces the construction of the classification tool focusing on its flexibility and extensibility. The result is a Machine Learning algorithm comparison and labeling tool combining different Natural Language preprocessing techniques. It also allows to test your own parameters and add different algorithms.