Citation
López Monzoncillo, Ángel
(2017).
Desarrollo de una extensión de CKAN para el análisis de datos abiertos.
Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S. de Ingenieros Informáticos (UPM), Madrid, España.
Abstract
CKAN es una plataforma opensource para compartir datos en abierto. Cualquier persona
que disponga de una cuenta en la plataforma puede subir datasets a la misma, sin embargo
para poder consumir dichos datasets no es necesario que el usuario se encuentre
registrado.
CKAN permite la implementación de extensiones que le modifican o amplían, debido a
su característica opensource. A través de estas extensiones se puede cambiar tanto la
interfaz gráfica de la plataforma como la funcionalidad de esta con el objetivo de
satisfacer las necesidades que requeridas.
Los datos en abierto pueden ser compartidos por cualquier persona y no disponen de
ningún standard que especifique las características que han de tener los recursos que
componen los datasets. Por lo que pueden existir recursos disponibles los cuales sean
complicados de reutilizar debido diversas características como la licencia bajo la que se
ha publicado, el formato del recurso o incluso que los datos que contiene están obsoletos.
Por ello es necesario disponer de una herramienta que proporcione al usuario una forma
de conocer la calidad de los recursos ahorrándole así esfuerzo en la reutilización del
mismo.
Para solucionar este problema que se existente en el mundo de los open data el trabajo
planteado consiste en la implementación de una extensión para la plataforma de datos
abiertos CKAN. Dicha extensión ha de ser capaz de evaluar los recursos de cada dataset
publicados en CKAN mediante la métrica MELODA. Ésta métrica mediante el análisis
de seis dimensiones referidas a los recursos de los datasets es capaz de indicar el nivel de
reusabilidad de cada recurso evaluado, es decir, indica la calidad del recurso para que otra
persona diferente al autor del mismo sea capaz de utilizar la información existente en
dicho recurso con cierta facilidad.
Gracias a la instalación de esta extensión los usuarios de la plataforma podrán conocer
cuales son los recursos más adecuados para sus objetivos sin necesidad de tener que hacer
una búsqueda exhaustiva de los mismos.---ABSTRACT---CKAN is an opensource platform to share open data. Anyone who have an account in
this platform can upload datasets to it. Nevertheless, in order that an user can consume
the existing datasets is not necessary for him to have an account.
CKAN allows implementing extensions which modify or extend it due to its opensource
nature. Through these extensions is possible to change the graphic interface and the
functionality of the platform in order to satisfy the required needs.
The open data can be shared by anyone and do not have any standards which specify the
characteristics that need to have the resources composing a dataset. Because of this, there
can be available resources which could be hard to reuse due to some of its characteristics.
These characteristics can be the license used to release the resource, its format or even
the outdated information which contains. Because of this problem is necessary have a tool
that provide users a way to know the quality of the resources saving effort when is reusing
it.
In order to solve this issue present in the world of open data the present work consists in
developing an extension for CKAN, a widely known open data platform. This extension
has been designed to assess the resources published in CKAN using MELODA metric.
By analysing the resources of a dataset through six dimensions, MELODA can indicate
their usability level. In other words, this metric shows the quality level of the evaluated
resource in order to enable other people to easily reuse the information of that resource.
Installing this extension users can know what the most appropriate resource according to
their needs is without making a great effort to find it.