Resumen
Este trabajo presenta una posible solución, que hará que las consultas de información ficheros README de software ciéntifico sea más fácil. Normalmente, cuando el software en ámbito de desarrollado en investigaciones y/o que tienen carácter científico, no es posible acceder de manera programática a la información, porque cada README está escrito en lenguaje natural, lo cual lleva a múltiples estilos de escritura diferentes, hechos por uno o varios desarrolladores del software. Para la extracción, es necesario usar técnicas de procesamiento de lenguaje natural [1]. Aunque ya existan frameworks que obtienen entidades, no es suficiente para generar un grafo de conocimiento completo. Por este motivo, el proyecto se centrará en crear una librería que busca y añade relaciones para completar grafo y proporcionar peticiones de estos software científicos. El alcance de este trabajo incluirá: Las técnicas y herramientas en las cuales se basará el modelo. La representación de los datos finales. Documentación de diseño creada para representar formalmente el modelo. Prototipo inicial, desarrollo y resultados producidos por este. Además, de las tareas anteriores, se analizará el impacto potencial de los resultados obtenidos de este proyecto, sus efectos positivos y negativos, si los hubiera, así como también las conclusiones y futuros desarrollos.---ABSTRACT---This work presents a possible solution, that will grant easier ways to make information consults from a README file of scientific software. Normally, when software from a investigation environment and/or a scientific character, it’s not posible to access that infomation in a manner, because each README is written in natural language, which leads to many differents styles of writting, made by one or more developers of such software. For the extraction, it is neccesary to use Natural Proccessing Language[1] techniques. Although there exists frameworks that obtain entities, it is not enough for generate a complet knowledge graph . Fpr this motive, the porject will focus on creating a library that searches and adds relationships for completing de graph and enable requests for this scientific softwares. The coverage will include: Techniques and tools in which our model will be based. The representation of our final data. Design documentation created to represent the model formally. Initial prototype, development and results produced by it. Also, from previous tasks, we will analyze the potencial impact this project, it’s positive and negative effects, if there are any, as well as it’s conclusions and future developments.