Reconocimiento facial automático mediante técnicas de visión tridimensional

Moreno Díaz, Ana Belén (2004). Reconocimiento facial automático mediante técnicas de visión tridimensional. Tesis (Doctoral), Facultad de Informática (UPM) [antigua denominación].

Descripción

Título: Reconocimiento facial automático mediante técnicas de visión tridimensional
Autor/es:
  • Moreno Díaz, Ana Belén
Director/es:
  • Pastor Pérez, Luis
  • Sánchez Calle, Angel
Tipo de Documento: Tesis (Doctoral)
Fecha: 2004
Materias:
Palabras Clave Informales: VISION ARTIFICIAL; TECNOLOGIA DE LOS ORDENADORES; CIENCIAS TECNOLOGICAS
Escuela: Facultad de Informática (UPM) [antigua denominación]
Departamento: Tecnología Fotónica [hasta 2014]
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
PDF (Document Portable Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (18MB) | Vista Previa

Resumen

En esta Tesis se presentan nuevas soluciones al problema del Reconocimiento Facial Automático enmarcadas dentro de la Visión Tridimensional. La Visión Tridimensional es la parte de la Visión por Computador que utiliza las propiedades tridimensionales de una escena real (obtenidas de su digitalización) para realizar una interpretación sobre la misma. En este caso, se trata de reconocer la cara humana, usando para ello información 3D. Este trabajo de investigación se ha centrado en la búsqueda de nuevos planteamientos que mejoren la robustez de los Sistemas de Reconocimiento Facial Automático ante variaciones de las distintas imágenes faciales de cada individuo. Así, se ha profundizado en metodologías que liberen en gran medida a estos sistemas, de su dependencia respecto de las condiciones de adquisición de las imágenes (iluminación, maquillaje, sombras, transformaciones geométricas, expresiones faciales, etc.), así como en la búsqueda de información 3D extraíble de las imágenes de caras humanas, que aporte un mayor poder de discriminación entre individuos. Para la evaluación de las técnicas propuestas, se ha creado una Base de Datos de imágenes faciales 3D, suficientemente amplia en cuanto a número de individuos y rica en variaciones entre imágenes de cada individuo. Dichas imágenes consisten en mallados tridimensionales que representan a las superficies faciales de forma realista, adquiridos mediante un digitalizador 3D. En este trabajo de Tesis se ha trabajado fundamentalmente con este tipo de imágenes desprovistas de su información de color, con objeto de conseguir eficiencia en los sistemas propuestos y de evitar los efectos perniciosos en estos sistemas causados por la variabilidad de las imágenes cuando aparecen sombras y cambios del tipo de iluminación. A continuación, se ha realizado un análisis en profundidad de la capacidad de discriminación de un gran número de posibles descriptores faciales 3D (un total de 86), que se han extraído automáticamente de los mallados de superficie. Este análisis ha fructificado en la obtención de un conjunto reducido de descriptores con gran capacidad de discriminación. Tales descriptores son invariantes ante transformaciones geométricas (rotaciones, traslaciones y escalados) pues se obtienen de regiones segmentadas de acuerdo al signo de los valores de curvatura local media y gaussiana. Por otra parte, estos descriptores se encuentran en zonas de la cara visibles, donde no hay presencia de barba, bigote, etc., y que sufren poca variación cuando se producen expresiones faciales. Tras este análisis, se propone como aportación de esta Tesis un sistema de reconocimiento facial automático que utiliza este conjunto de descriptores de las superficies faciales 3D, del que se ha abordado la metodología para automatizar todas sus etapas. Una de las etapas necesarias en numerosos sistemas de reconocimiento facial automático es la de corrección o normalización de la pose (posición y orientación) de las imágenes. Dicho proceso puede realizarse para imágenes faciales 3D de rango, si se cuenta con un número suficiente de puntos de la superficie facial que se puedan utilizar para el cálculo de la transformación geométrica de normalización. En esta Tesis se aportan dos métodos de localización automática de puntos faciales 3D en mallados tridimensionales de superficie, para este propósito. Por otra parte, en algunas aplicaciones de Medicina Forense, Antropología o de las Fuerzas de Seguridad se precisa la intervención manual de un usuario, para seleccionar puntos faciales. Se aporta en esta Tesis Doctoral una herramienta de software (basada en visión estereoscópica) orientada a la obtención de puntos faciales 3D de forma precisa, a partir de sus proyecciones 2D o correspondencias en varias imágenes, seleccionadas manualmente. Para el diseño de esta herramienta se han tenido en cuenta las necesidades de los usuarios finales. Con objeto de profundizar aún más en la búsqueda de información 3D que discrimine mejor a las caras humanas, se han experimentado otros sistemas de reconocimiento facial que no requieran una etapa de localización de características. Dichos sistemas emplean información holística 3D de la cara, que incluye nuevas representaciones de la forma 3D aportadas en esta Tesis (fundamentalmente composiciones de secciones de volumen). El reconocimiento a partir de diferentes representaciones 3D de este tipo, obtenidas a partir de los mallados faciales, se ha experimentado con éxito sobre dos sistemas basados en técnicas ampliamente utilizadas en la literatura de Reconocimiento Facial Automático aplicadas habitualmente cuando se realiza a partir de imágenes 2D: el Análisis de Componentes Principales (PCA) y Support Vector Machines (SVM), respectivamente. Para que estas técnicas puedan tomar como patrones de entrada representaciones holísticas de mallados tridimensionales, se ha propuesto la inclusión de una etapa previa de corrección de la pose de las imágenes 3D. También se ha aportado una representación volumétrica regular mediante vóxeles (obtenida a partir de los mallados faciales) para disponer de patrones de entrada alternativos a los mapas de profundidad, que se habían empleado hasta el momento en este tipo de sistemas de reconocimiento facial 3D holísticos. Palabras clave: Visión Artificial, Visión Tridimensional, Reconocimiento de Patrones, Reconocimiento Facial Automático, Biometría.

Más información

ID de Registro: 625
Identificador DC: http://oa.upm.es/625/
Identificador OAI: oai:oa.upm.es:625
Depositado por: Archivo Digital UPM
Depositado el: 03 Nov 2007
Ultima Modificación: 20 Abr 2016 06:24
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • e-ciencia
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM