Artificial bee colony optimizer applied to text classification problems

Gutiérrez Tamayo, Laura (2020). Artificial bee colony optimizer applied to text classification problems. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. de Sistemas Informáticos (UPM), Madrid.

Description

Title: Artificial bee colony optimizer applied to text classification problems
Author/s:
  • Gutiérrez Tamayo, Laura
Contributor/s:
  • Gómez Canaval, Sandra
Item Type: Final Project
Degree: Grado en Ingeniería del Software
Date: July 2020
Subjects:
Freetext Keywords: Metaheurística bioinspirada; Minería de texto; Minería de opinión; Artificial Bee Colony (ABC)
Faculty: E.T.S.I. de Sistemas Informáticos (UPM)
Department: Sistemas Informáticos
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img] PDF - Users in campus UPM only - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (3MB)
[img] Archive (ZIP) - Users in campus UPM only
Download (1kB)

Abstract

La cantidad de datos generados cada minuto está planteando grandes desafíos en el procesamiento de la información, en términos de rendimiento, precisión y recursos. La informática bioinspirada es un campo de estudio poco convencional que puede ofrecer una alternativa para resolver problemas de no lineales, NP complejos y problemas de optimización discreta. Este Proyecto Final de Grado tiene como objetivo explorar metaheurísticas bioinspiradas para resolver problemas de clasificación. Artificial Bee Colony (ABC) es uno de los algoritmos bioinspirados más conocidos, que se basa en la inteligencia de los enjambres de abejas. El algoritmo ABC proporciona un buen equilibrio entre explotación y exploración en problemas de optimización. El algoritmo asegura que el coste o la función objetivo y el fitness es calculado para cada una de las posibles soluciones. Posteriormente, este valor se compara con otras soluciones dentro del espacio de búsqueda local y toma la solución con mayor fitness, lo que estimula la explotación. Para evitar que el algoritmo caiga en mínimos locales, éste utiliza una estrategia que simula el comportamiento de las "abejas exploradoras" creando una nueva solución aleatoria dentro del espacio de búsqueda global para amplificar la exploración. El algoritmo ABC proporciona una base hiper heurística, que se ha aplicado principalmente en problemas para superar el mínimo local, las optimizaciones multi-objetivo de objetivos y la optimización de redes. En este proyecto, el algoritmo Artificial Bee Colony (ABC) será adaptado para optimizar los problemas de clasificación de texto y se comparará con un algoritmo tradicional K-Nearest Neighbor (KNN). Ambos algoritmos se implementarán y probarán en un entorno independiente desde una perspectiva iterativa, se comparará la eficiencia y la calidad de las soluciones. Para desarrollar y probar los algoritmos seleccionados, se ha creado un marco computacional que utiliza Python sobre Dash Plotly. Este marco reutilizable es capaz de cargar, implementar, ejecutar, analizar y visualizar los algoritmos implementados que se ejecutan en cualquier conjunto de datos. Se implementó un dashboard intuitivo y reutilizable para ofrecer al usuario final una herramienta de visualización adecuada. El dominio del problema a resolver es la Opinion Mining (OM) aplicada a los tweets políticos, utilizando conjuntos de datos públicos. Abstract: The amount of data generated every minute is setting big challenges in processing the information, in terms of performance, accuracy, and resources. Bio-inspired computing is a non-conventional field of study that can offer an alternative for solving nonlinear, NP complex and discrete optimization problems. This Final Degree Project aims to explore bio-inspired metaheuristics to solve classification problems. Artificial Bee Colony (ABC) is one of the most well-known bio-inspired algorithms, which is based on bee’s swarm intelligence. The ABC algorithm provides a good balance between exploitation and exploration in optimization problems. The algorithm ensures that the cost or objective function and the fitness of each solution is calculated, and then compared with other solutions within the local area stimulating the exploitation, to avoid local minimum, the behavior of "scouts bees" are simulated by creating a new random solution within the global search space to amplify exploration. The ABC algorithm provides a hyper-heuristic based, which has been mainly applied in problems to overcome the local minimum, optimization of multi-objective design and optimization of networks. In this project, the Artificial Bee Colony (ABC) will be specified to optimize text classification problems and will be compared to a traditional algorithm K-nearest Neighbor (KNN). Both algorithms will be deployed and tested in a standalone environment from an iterative perspective, the efficiency and solutions quality will be compared. In order to develop and test the selected algorithms, a computational framework using Python over Dash Plotly has been built. This reutilizable framework is able to load, deploy, execute, analyze and visualize the implemented algorithms running over any dataset. An intuitive and usable dashboard was implemented to offer the end user a suitable visualization tool. The domain of the problem to be solved is Opinion Mining (OM) applied to political tweets, using public datasets.

More information

Item ID: 64492
DC Identifier: http://oa.upm.es/64492/
OAI Identifier: oai:oa.upm.es:64492
Deposited by: Biblioteca Universitaria Campus Sur
Deposited on: 08 Oct 2020 08:26
Last Modified: 08 Oct 2020 08:26
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM