Saliency maps and attention residual learning for low quality face recognition

Dublin Core

Title

Saliency maps and attention residual learning for low quality face recognition

Subject

Reconocimiento facial
Arcface
Reconocimiento facial de baja calidad
Mapas de prominencia
Aprendizaje de atención residual
620
Ingeniería

Description

Tesis (Master of Science in Engineering)--Pontificia Universidad Católica de Chile, 2022
En los últimos años, los modelos basados en redes neuronales convolucionales profundas (DCNNs, por sus siglas en inglés) han logrado un rendimiento excepcional en tareas de reconocimiento facial en muchos conjuntos de datos conocidos, donde la calidad de las imágenes faciales es relativamente buena. Sin embargo, en imágenes faciales de baja calidad, la precisión de estos modelos disminuye considerablemente. Uno de los modelos mas relevantes en el campo de reconocimiento facial es Arcface, un modelo DCNN que mantiene resultados de precisión entre los 3 primeros puestos en varios conjuntos de datos de referencia relevantes. Para evaluar el rendimiento del modelo de reconocimiento facial en condiciones de baja calidad, entrenamos y probamos extensamente a Arcface en diferentes escenarios de calidad. Observamos que la precisión de Arcface cayó significativamente cuando la calidad de las imágenes faciales se vio comprometida. Para mejorar el rendimiento en imágenes de baja calidad, proponemos varias estrategias de entrenamiento con ajuste fino sobre Arcface. Nuestros resultados muestran mejoras significativas entre
9.71-14.63% al aplicar ajustes finos al modelo. Además, desarrollamos múltiples variaciones de Arcface derivadas de dos enfoques principales: por un lado, entrenamientos con mapas de prominencia autogenerados y, por el otro lado, utilizando bloques de aprendizaje de atención residual (ARL, por sus siglas en inglés) que conforman la columna vertebral del modelo Arcface conocida como ResNet100. Concluimos que los modelos DCNN ya son altamente capaces de discriminar regiones semánticamente relevantes de las imágenes faciales, por lo que el uso de mapas de prominencia o bloques ARL solo mejoran levemente la precisión del modelo en algunos casos particulares en el orden de 0.15% a 0.64%. Para futuros experimentos, presentamos LQ-Faces, el nuevo conjunto de datos de imágenes faciales de baja calidad que ha sido utilizado en nuestro trabajo.

Creator

Buscaglia Hardy, Enzo Maximiliano

Date

2022-11-29T13:40:19Z
2022-11-29T13:40:19Z
2022

Contributor

Mery Quiroz, Domingo
Pontificia Universidad Católica de Chile. Escuela de Ingeniería

Rights

acceso abierto

Format

x, 35 páginas
application/pdf

Language

en

Type

tesis de maestría

Identifier

10.7764/tesisUC/ING/65819
https://doi.org/10.7764/tesisUC/ING/65819
https://repositorio.uc.cl/handle/11534/65819