@unpublished{upm39348, title = {Query Rewriting Optimisation Techniques for Ontology-Based Data Access}, school = {ETSI\_Informatica}, author = {Jos{\'e} Mora L{\'o}pez}, year = {2015}, url = {http://oa.upm.es/39348/}, abstract = {Ontology-Based Data Access (OBDA) permite el acceso a diferentes tipos de fuentes de datos (tradicionalmente bases de datos) usando un modelo m{\'a}s abstracto proporcionado por una ontolog{\'i}a. La reescritura de consultas (query rewriting) usa una ontolog{\'i}a para reescribir una consulta en una consulta reescrita que puede ser evaluada en la fuente de datos. Las consultas reescritas recuperan las respuestas que est{\'a}n implicadas por la combinaci{\'o}n de los datos explicitamente almacenados en la fuente de datos, la consulta original y la ontolog{\'i}a. Al trabajar s{\'o}lo sobre las queries, la reescritura de consultas permite OBDA sobre cualquier fuente de datos que puede ser consultada, independientemente de las posibilidades para modificarla. Sin embargo, producir y evaluar las consultas reescritas son procesos costosos que suelen volverse m{\'a}s complejos conforme la expresividad y tama{\~n}o de la ontolog{\'i}a y las consultas aumentan. En esta tesis exploramos distintas optimizaciones que peuden ser realizadas tanto en el proceso de reescritura como en las consultas reescritas para mejorar la aplicabilidad de OBDA en contextos realistas. Nuestra contribuci{\'o}n t{\'e}cnica principal es un sistema de reescritura de consultas que implementa las optimizaciones presentadas en esta tesis. Estas optimizaciones son las contribuciones principales de la tesis y se pueden agrupar en tres grupos diferentes: -optimizaciones que se pueden aplicar al considerar los predicados en la ontolog{\'i}a que no est{\'a}n realmente mapeados con las fuentes de datos. -optimizaciones en ingenier{\'i}a que se pueden aplicar al manejar el proceso de reescritura de consultas en una forma que permite reducir la carga computacional del proceso de generaci{\'o}n de consultas reescritas. -optimizaciones que se pueden aplicar al considerar metainformaci{\'o}n adicional acerca de las caracter{\'i}sticas de la ABox. En esta tesis proporcionamos demostraciones formales acerca de la correcci{\'o}n y completitud de las optimizaciones propuestas, y una evaluaci{\'o}n emp{\'i}rica acerca del impacto de estas optimizaciones. Como contribuci{\'o}n adicional, parte de este enfoque emp{\'i}rico, proponemos un banco de pruebas (benchmark) para la evaluaci{\'o}n de los sistemas de reescritura de consultas. Adicionalmente, proporcionamos algunas directrices para la creaci{\'o}n y expansi{\'o}n de esta clase de bancos de pruebas. ABSTRACT Ontology-Based Data Access (OBDA) allows accessing different kinds of data sources (traditionally databases) using a more abstract model provided by an ontology. Query rewriting uses such ontology to rewrite a query into a rewritten query that can be evaluated on the data source. The rewritten queries retrieve the answers that are entailed by the combination of the data explicitly stored in the data source, the original query and the ontology. However, producing and evaluating the rewritten queries are both costly processes that become generally more complex as the expressiveness and size of the ontology and queries increase. In this thesis we explore several optimisations that can be performed both in the rewriting process and in the rewritten queries to improve the applicability of OBDA in real contexts. Our main technical contribution is a query rewriting system that implements the optimisations presented in this thesis. These optimisations are the core contributions of the thesis and can be grouped into three different groups: -optimisations that can be applied when considering the predicates in the ontology that are actually mapped to the data sources. -engineering optimisations that can be applied by handling the process of query rewriting in a way that permits to reduce the computational load of the query generation process. -optimisations that can be applied when considering additional metainformation about the characteristics of the ABox. In this thesis we provide formal proofs for the correctness of the proposed optimisations, and an empirical evaluation about the impact of the optimisations. As an additional contribution, part of this empirical approach, we propose a benchmark for the evaluation of query rewriting systems. We also provide some guidelines for the creation and expansion of this kind of benchmarks.} }