Interactive structural learning for discrete Bayesian network classifiers

Tello López, Iván Eugenio (2023). Interactive structural learning for discrete Bayesian network classifiers. Thesis (Master thesis), E.T.S. de Ingenieros Informáticos (UPM).

Description

Title: Interactive structural learning for discrete Bayesian network classifiers
Author/s:
  • Tello López, Iván Eugenio
Contributor/s:
Item Type: Thesis (Master thesis)
Masters title: Inteligencia Artificial
Date: July 2023
Subjects:
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Inteligencia Artificial
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[thumbnail of TFM_IVAN_EUGENIO_TELLO_LOPEZ.pdf] PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB)

Abstract

Los modelos explicables son aquellos que necesitan de otro modelo u otras técnicas para entender las decisiones tomadas por este. En cambio, los modelos interpretables son entendibles directamente por el ser humano. Es por eso que muchos autores indican que el futuro debería ser el estudio de los modelos encuadrados en la segunda categoría. Uno de los modelos más importantes de esta categoría son las redes Bayesianas.

En este trabajo, se presenta la implementación de una interfaz gráfica y de diferentes técnicas para mejorar la interpretabilidad intrínseca de las redes Bayesianas, en concreto de las redes Bayesianas aplicadas a la clasificación supervisada: los clasificadores Bayesianos.

Además de esto, se propone un nuevo método para encontrar el manto de Markov óptimo de la variable clase, esto es importante ya que el manto de Markov indica cuáles son las variables que afectan más a la variable clase permitiendo así descartar el resto, ya que no aportan información extra, esta característica se usa sobre todo en problemas de selección de variables, un proceso indispensable para problemas que utilicen muchas variables. Para encontrarlo, se ha hecho uso de los algoritmos de estimación de distribución (EDAs en su acrónimo en lengua inglesa), se han escogido este tipo de algoritmos ya que, en espacios de búsqueda muy grandes, las búsquedas exhaustivas son intratables por lo que, aunque no aseguren alcanzar el óptimo, por las ventajas que ofrecen en términos de rendimiento y de computación los EDAs pueden ser una buena solución a este problema.

Además, al nuevo modelo se le aplicaran diferentes técnicas de interpretabilidad además de incluir nuevas técnicas para facilitar al usuario el entendimiento de la evolución de las soluciones a lo largo de las generaciones.

ABSTRACT

utilizándola incluso para tomar decisiones en campos como el sanitario o el financiero, en los que es necesario entender los resultados o predicciones que proporciona el modelo. Debido a esto, surgen dos ramas en las que dividir los modelos dentro de la.Ex Explainable AI"(XAI): los modelos interpretables y los modelos explicables. Due to the rise of Artificial Intelligence, its use has become more and more commonplace, even being used to make decisions in fields such as healthcare or finance, where it is necessary to understand the results or predictions provided by the model. Because of this, there are two branches into which models can be divided: interpretable models and explainable models.

Explainable models are those that need another model or other techniques to understand the decisions made by the model. On the other hand, interpretable models are directly understandable by humans. This is why some authors indicate that the future should be the study of models of the second category. One of the most important models in this category are Bayesian networks.

In this work, we present the implementation of a graphical interface with interaction and different techniques to improve the intrinsic interpretability of Bayesian networks, specifically Bayesian networks applied to supervised classification: Bayesian classifiers.

In addition to this, a new method to find the optimal Markov blanket of the class variable. This is important since the Markov blanket indicates which variables affect the class variable the most, thus allowing to discard the rest, since they do not provide extra information. This feature is used mainly in variable selection problems, an indispensable process for problems that use many variables. To find it To find it, we have made use of Estimation of Distribution Algorithms (EDAs) is proposed. This type of algorithms has been chosen because in very large search spaces, exhaustive searches are intractable, so although they do not ensure reaching the optimum, due to the advantages they offer in terms of performance and computation, EDAs can be a good solution to this problem.

In addition, different interpretability techniques will be applied to the new model and new techniques will be included to facilitate the user’s understanding of the evolution of the solutions throughout the generations.

More information

Item ID: 75868
DC Identifier: https://oa.upm.es/75868/
OAI Identifier: oai:oa.upm.es:75868
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 14 Sep 2023 11:23
Last Modified: 14 Sep 2023 11:23
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM