Extracción de datos de Contratación Pública del Estado y transformación en ficheros en format CSV

Stan, George Alexandru (2021). Extracción de datos de Contratación Pública del Estado y transformación en ficheros en format CSV. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S. de Ingenieros Informáticos (UPM), Madrid, España.

Description

Title: Extracción de datos de Contratación Pública del Estado y transformación en ficheros en format CSV
Author/s:
  • Stan, George Alexandru
Contributor/s:
  • Corcho, Oscar
Item Type: Final Project
Degree: Grado en Ingeniería Informática
Date: May 2021
Subjects:
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Inteligencia Artificial
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB) | Preview

Abstract

En los últimos años, en todos los ámbitos de negocio se ha buscado sin cesar una mayor transparencia de las actividades realizadas, los bienes y servicios empleados y el capital invertido en las mismas, y sobre todo en el sector relacionado con los contratos y licitaciones Públicas. Es por esto, que desde la primera publicación de un estándar relacionado con los datos de las Administraciones Públicas este ha sido mejorado, continuando con la búsqueda de una mayor transparencia de los datos. Este estándar desarrollado por el Ministerio de Economía y Hacienda se denomina CODICE, y es un estándar nacional que marca las directrices a seguir por las entidades implicadas en el desarrollo de un Proceso de Licitación Pública en la generación de documentos y ficheros con los datos del mismo. El segundo objetivo, pero no menos importante, de este afán por conseguir una mayor transparencia de estos procesos es permitir que los datos publicados sean más accesibles y permitir su uso y redistribución por un mayor número de personas, ya sean usuarios noveles o profesionales del área administrativa. Para ello, las Administraciones Públicas actualizan los datos de los diferentes contratos en la Plataforma de Contratación Pública del Estado, que a su vez, publica los documentos, ya en forma de datos abiertos, en el Portal Institucional del Ministerio de Hacienda mediante ficheros comprimidos que en su interior contiene archivos en formato XML. A raíz de esto, y con la motivación de dotar a los datos de una mayor legibilidad, el objetivo de este proyecto es la extracción de los datos de Contratación Pública y generar ficheros con formato .csv, ya que los datos organizados en estructuras de tablas permiten un mayor entendimiento a los usuarios noveles o que estén poco familiarizados con las tecnologías. Para alcanzar este objetivo, se ha realizado un análisis previo de la estructura de los ficheros de Contratación Pública y de los diferentes campos integrados en los mismos tal y como se explica más adelante en este documento para definir las opciones de generación de ficheros y saber qué ficheros generar y cuántos.---ABSTRACT---In recent years, in all areas of business there has been a constant search for greater transparency of the activities carried out, the goods and services used and the capital invested in them, and especially in the sector related to public contracts and tenders. This is why, since the first publication of a standard related to Public Administration data, it has been improved continuing the search for greater data transparency. This standard developed by the Ministry of Economy and Finance is called CODICE, and it is a national standard that sets the guidelines to be followed by the entities involved in the development of a Public Bidding Process for the generation of documents and files. The second objective, but no less important, of this effort to achieve greater transparency in these processes, is to make the published data more accessible and allow its use and redistribution by a greater number of people, whether they are novice users or professionals in the administrative area. To this end, the Public Administrations update the data of the different contracts on the State Public Procurement Platform, which in turn publishes the documents, already in the form of open data, on the Institutional Portal of the Ministry of Finance through compressed files that contain files in XML format. As a result of this, and with the aim of making the data more readable, the objective of this project is to extract the Public Procurement data and generate files in .csv format, since the data organized in table structures allow a better understanding for novice users or those who are unfamiliar with IT. To achieve this objective, a previous analysis of the structure of the Public Procurement files and of the different fields integrated in them has been carried out as explained later in this document, in order to define the file generation options and to know which files to generate and how many.

More information

Item ID: 68121
DC Identifier: https://oa.upm.es/68121/
OAI Identifier: oai:oa.upm.es:68121
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 01 Aug 2021 05:34
Last Modified: 01 Aug 2021 05:34
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM