Citation
Stan, George Alexandru
(2021).
Extracción de datos de Contratación Pública del Estado y transformación en ficheros en format CSV.
Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S. de Ingenieros Informáticos (UPM), Madrid, España.
Abstract
En los últimos años, en todos los ámbitos de negocio se ha buscado sin cesar una mayor transparencia de las actividades realizadas, los bienes y servicios empleados y el capital invertido en las mismas, y sobre todo en el sector relacionado con los contratos y licitaciones Públicas. Es por esto, que desde la primera publicación de un estándar relacionado con los datos de las Administraciones Públicas este ha sido mejorado, continuando con la búsqueda de una mayor transparencia de los datos. Este estándar desarrollado por el Ministerio de Economía y Hacienda se denomina CODICE, y es un estándar nacional que marca las directrices a seguir por las entidades implicadas en el desarrollo de un Proceso de Licitación Pública en la generación de documentos y ficheros con los datos del mismo. El segundo objetivo, pero no menos importante, de este afán por conseguir una mayor transparencia de estos procesos es permitir que los datos publicados sean más accesibles y permitir su uso y redistribución por un mayor número de personas, ya sean usuarios noveles o profesionales del área administrativa. Para ello, las Administraciones Públicas actualizan los datos de los diferentes contratos en la Plataforma de Contratación Pública del Estado, que a su vez, publica los documentos, ya en forma de datos abiertos, en el Portal Institucional del Ministerio de Hacienda mediante ficheros comprimidos que en su interior contiene archivos en formato XML. A raíz de esto, y con la motivación de dotar a los datos de una mayor legibilidad, el objetivo de este proyecto es la extracción de los datos de Contratación Pública y generar ficheros con formato .csv, ya que los datos organizados en estructuras de tablas permiten un mayor entendimiento a los usuarios noveles o que estén poco familiarizados con las tecnologías. Para alcanzar este objetivo, se ha realizado un análisis previo de la estructura de los ficheros de Contratación Pública y de los diferentes campos integrados en los mismos tal y como se explica más adelante en este documento para definir las opciones de generación de ficheros y saber qué ficheros generar y cuántos.---ABSTRACT---In recent years, in all areas of business there has been a constant search for greater transparency of the activities carried out, the goods and services used and the capital invested in them, and especially in the sector related to public contracts and tenders. This is why, since the first publication of a standard related to Public Administration data, it has been improved continuing the search for greater data transparency. This standard developed by the Ministry of Economy and Finance is called CODICE, and it is a national standard that sets the guidelines to be followed by the entities involved in the development of a Public Bidding Process for the generation of documents and files. The second objective, but no less important, of this effort to achieve greater transparency in these processes, is to make the published data more accessible and allow its use and redistribution by a greater number of people, whether they are novice users or professionals in the administrative area. To this end, the Public Administrations update the data of the different contracts on the State Public Procurement Platform, which in turn publishes the documents, already in the form of open data, on the Institutional Portal of the Ministry of Finance through compressed files that contain files in XML format. As a result of this, and with the aim of making the data more readable, the objective of this project is to extract the Public Procurement data and generate files in .csv format, since the data organized in table structures allow a better understanding for novice users or those who are unfamiliar with IT. To achieve this objective, a previous analysis of the structure of the Public Procurement files and of the different fields integrated in them has been carried out as explained later in this document, in order to define the file generation options and to know which files to generate and how many.