Abstract
En este Trabajo Fin de Máster se ha desarrollado un sistema de reconocimiento multi-clase de vehículos en flujos de vídeo, el cual forma parte de un proyecto de investigación subvencionado por la Dirección General de Tráfico (DGT) titulado “Análisis del comportamiento de vehículos mediante clasificación automática”. Para este propósito, se han elaborado bases de datos anotadas de carreteras que se han creado a partir de las imágenes públicas proporcionadas por la DGT y de otras grabaciones de cámaras de tráfico de otros países.
El sistema propuesto emplea una malla estructurada y espacial de clasificadores foveales (o foveáticos) que tienen la misión de reconocer la presencia de un vehículo de una determinada clase en una zona de atención dentro de la imagen, la cual es aprendida de forma automática durante el proceso de entrenamiento. Para ello, los clasificadores utilizan una entrada común formada por un vector de características que representa completamente cada imagen.
Para el entrenamiento de los clasificadores foveales, se han probado varias configuraciones de la malla espacial, varios algoritmos de extracción de características y dos estrategias de entrenamiento basados en el uso simultáneo de toda la base de datos (entrenamiento “off-line”), y el uso de lotes o subconjuntos de ésta (entrenamiento “on-line”).
El sistema propuesto presenta unas importantes ventajas tales como la posibilidad de reconocer vehículos ocluidos por otros o por elementos de la escena, la capacidad de conocer el aspecto que tienen los vehículos en distintos lugares de la escena, su adaptabilidad en diferentes condiciones de iluminación, incluyendo vídeo nocturno, que está muy escasamente abarcado en el estado del arte, y su validez de uso en imágenes capturadas con cámaras omnidireccionales. Además, el sistema desarrollado es capaz de operar en tiempo real.