Abstract
Actualmente existe una gran cantidad de información publicada en la Web en forma de noticias online y blogs. Los usuarios que requieren usar dicha información para distintos propósitos (desde intereses personales a toma de decisiones profesionales) necesitan saber de su procedencia y su evolución con el fin de determinar su calidad y aplicarle un determinado grado de confianza.
Se han desarrollado diversos modelos de provenance con el propósito de representar y gestionar el historial de los contenidos en una gran cantidad de dominios distintos. Sin embargo aplicarlos en escenarios reales plantea retos metodológicos y tecnológicos aún no resueltos, tal y como ha señalado el W3C Provenance Incubator Group. En esta tesis definimos un marco de comparación para analizar las distintas propuestas, y justificamos la selección de la más apropiada, el “Open Provenance Model” (OPM), como referencia para modelar un escenario real de noticias online y blogs, en un contexto de turismo, para una de las empresas de comunicaciones y publicaciones más importantes de nuestro país: PRISACOM. Además, en este documento se define un servicio de anotación y recuperación de provenance usando el modelo previo como referencia, describiendo las decisiones de modelado y de diseño efectuadas en el contexto del uso y gestión de provenance para una serie de plataformas pertenecientes a la compañía. Finalmente, se presenta la evaluación realizada, con unos resultados prometedores que solucionan los retos planteados en los objetivos del proyecto. Señalar también que nuestro caso de uso es una contribución adicional, porque muestra cómo el OPM puede ser utilizado fuera de dominios científicos, que es donde ha sido comúnmente aplicado hasta el momento.
Durante el periodo en el que se ha realizado este trabajo, el autor ha sido miembro del W3C Provenance Incubator Group (realizando múltiples contribuciones a su informe final ), y ha participado en la discusión acerca de los mappings entre los modelos de provenance de mayor aceptación en la comunidad científica