Development of a model with Bayesian network for Data Driven Materials

Ramírez Lavín, Adrián (2019). Development of a model with Bayesian network for Data Driven Materials. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. de Sistemas Informáticos (UPM), Madrid.

Description

Title: Development of a model with Bayesian network for Data Driven Materials
Author/s:
  • Ramírez Lavín, Adrián
Contributor/s:
  • Peña Espartero, Jose Maria
Item Type: Final Project
Degree: Grado en Ingeniería Telemática
Date: 13 February 2019
Subjects:
Freetext Keywords: Lenguaje de programación R; Redes Bayesianas
Faculty: E.T.S.I. de Sistemas Informáticos (UPM)
Department: Otro
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (2MB) | Preview
[img] Archive (ZIP) - Users in campus UPM only
Download (1kB)

Abstract

Este proyecto presenta un modelo que será de gran utilidad en el área de la ciencia de materiales. Teniendo en cuenta las propiedades de las redes Bayesianas, que son capaces de medir el nivel de independencia entre las variables presentes en el problema. A lo largo de la historia el ser humano ha estado buscando el mejor material y actualmente grandes empresas invierten una gran cantidad de dinero en ello. Se busca un material barato y eficiente, ese es el motivo por el cual la búsqueda de una combinación precisa de elementos químicos se está llevando a cabo. Tradicionalmente, la ciencia de los materiales ha consistido en mezclar diferentes elementos, pero debido a la gran cantidad de tiempo y dinero que hay que invertir para ello esto no es una técnica aceptable. En los últimos veinte años, grandes empresas han desarrollado diferente software para mezclar elementos, sin embargo está limitado porque no acepta un número infinito de combinaciones. Dada la necesidad de buscar la red Bayesiana más eficiente merece la pena llevar a cabo investigación. En lo que al medioambiente se refiere, este nuevo diseño es beneficioso teniendo en cuenta de que al simular las combinaciones no es necesario desperdiciar materiales. El objetivo de este trabajo es desarrollar un modelo para computar las cualidades de las diferentes combinaciones usando el lenguaje de programación R. R proporciona librerías relacionadas con las Redes Bayesianas, por ese motivo ha sido elegido como el lenguaje para desarrollar el modelo. No es necesario implementar nuevos algoritmos complejos puesto que es posible utilizar los que proporciona la librería. El objetivo final del proyecto es desarrollar un modelo para predecir algunas de las capacidades de cada material. Por esa razón antes de desarrollar el modelo se han necesitado algunos pasos para procesar la información proporcionada. Este algoritmo para hacer los datos proporcionados útiles se incluirá en el objetivo general del proyecto. Por último también se busca contribuir lo máximo posible en el proceso revolucionario de cambios que está ocurriendo alrededor del mundo en el campo del modelado de materiales usando ciencia de datos. El proyecto se ha dividido en tres partes. En la primera parte se desarrollan algunos conceptos teóricos. Esto se explica para dar al lector algo de información acerca de las redes Bayesianas. Estos conceptos no se explican profundizando en todos los detalles debido a que esta área es muy extensa, no obstante se proporcionan diferentes fuentes bibliográficas que permiten al lector profundizar en la materia. En la segunda parte, se proporcionan especificaciones y limitaciones del algoritmo, explicando de esta manera algunas restricciones de las redes Bayesianas. También se mostrará una guía de instalación del lenguaje R. En la tercera parte se presenta el resultado final, explicando cómo funciona el algoritmo y mostrando gráficos sobre el algoritmo y sobre los resultados. En esta tercera parte, se muestran métodos de validación, ilustrados con pequeñas piezas de pseudocódigo. Finalmente el uso de la red Bayesiana computada se prueba calculando diferentes probabilidades sobre la red. Abstract: This project presents a model which will be really useful in the area of material science. Taking into account the features of Bayesian networks which are able to compute the level of independence between given variables. Along the history human beings have been searching for the best material and nowadays, the biggest companies are investing great amount of money in it. They look for a low-cost and efficient material that is the reason why it is underway the searching of the accurate combination of chemical elements. Traditionally, material science has consisted in trying different mixtures of element but obviously that is not acceptable regarding money and time. In the last twenty years big enterprises have implement computer software in order to try element mixtures however it is not affordable to try with the infinites different combinations. Given the need to search for the most efficient combination Bayesian Networks may be worth investigation. With regard to the environment this new design it is also beneficial due to the fact that it is not needed the waste of different materials trying new combinations. The goal of this work is to develop a model to compute determined qualities of some combinations using the programming language R. R provide some libraries related to Bayesian Networks for that reason it is going to be developed in that language. It is not needed to implement new complex algorithms, it is possible to use that which are provided by that libraries. The final goal of this project is to develop a model to predict some features of each material. For this reason before developing the model we have needed some steps to process the information given. This algorithm to make data useful will be included in the overall goal of the project. Another goal will be to contribute as much as possible in the revolutionary change which is taking place all over the world in the field of modeling materials using data science. The project has been divided in three big different parts. In the first part some theoretical concepts have been developed. This has been explained to give the reader some background about Bayesian Networks. This concepts have not been explained thoroughly due to the extension of this field but some bibliographical sources have been given. In the second part the specification and limitations of the algorithm have been addressed, explaining some restrictions of Bayesian Networks. A setting up guide of language R have been shown as well. In the third part the solution itself has been provided, explaining how the algorithm works, showing charts about it and about the obtained results. In this third part validation methods have been shown, illustrated with small pieces of code or pseudo code. Finally the use of the new Bayesian Network has been shown by calculating different probabilities related to the network.

More information

Item ID: 55000
DC Identifier: http://oa.upm.es/55000/
OAI Identifier: oai:oa.upm.es:55000
Deposited by: Biblioteca Universitaria Campus Sur
Deposited on: 14 May 2019 08:50
Last Modified: 14 May 2019 08:50
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM