Abstract
Los métodos de descripción de imágenes basados en características locales de apariencia son una de las áreas de investigación más importantes en visión por computador. Muchas de las aplicaciones, como por ejemplo la clasificación de imágenes, la recuperación de imágenes, la reconstrucción 3D y la construcción de mosaios, se basan en la extracción y descripción de características locales de apariencia. La calidad estas descripciones afecta directamente a la rendimiento final de la tarea. Por otro lado, la constante mejora del hardware de los dispositivos móviles hace posible llevar multitud de aplicaciones de la visión por computador a estos dispositivos. Sin embargo, todavía no está claro si estos descriptores son adecuados para un funcionamiento preciso y un procesamiento en tiempo real en este tipo de dispositivos. En esta tesis evaluamos el rendimiento de algunos de los descriptores de características locales más relevantes, tanto en ordenadores de sobremesa estándar, con y sin GPU, como en dispositivos Android. Evaluamos su precisión, su eficiencia computacional y el consumo de energía. De nuestros experimentos concluimos que, a pesar de la alta precisión de los descriptores basados en aprendizaje profundo, todavía no son muy adecuados para su uso en dispositivos móviles. Esto se debe a sus altos requisitos computacionales. En comparación, algunos descriptores binarios recientes representan un buen compromiso entre precisión y eficiencia.---ABSTRACT---Image description methods based on local appearance characteristics are one of the most important research areas in computer vision. Many applications, such as image classification, image retrieval, 3D reconstruction, and image stitching, are based on the extraction and description of local appearance features. The quality of these descriptions directly affects the final performance of the task. On the other hand, the constant improvement of mobile device hardware makes it possible to bring a multitude of computer vision applications to these devices. However, it is not yet clear whether these descriptors are adequate for accurate operation and real-time processing on these types of devices. In this thesis we evaluate the performance of some of the the most relevant local feature descriptors on both standard desktop computers, with and without GPU, and on Android devices. We evaluate their accuracy, their computational efficiency and power consumption. From our experiments we conclude that, despite the high accuracy of descriptors based on deep learning models, they are not very suitable for mobile devices. This is due to their high computational requirements. In comparison, recent binary descriptors learned with traditional techniques represent a good tradeoff between accuracy and efficiency.