Saliency maps and attention residual learning for low quality face recognition

Title

Subject

Reconocimiento facial

Arcface

Reconocimiento facial de baja calidad

Mapas de prominencia

Aprendizaje de atención residual

620

Ingeniería

Description

Tesis (Master of Science in Engineering)--Pontificia Universidad Católica de Chile, 2022

En los últimos años, los modelos basados en redes neuronales convolucionales profundas (DCNNs, por sus siglas en inglés) han logrado un rendimiento excepcional en tareas de reconocimiento facial en muchos conjuntos de datos conocidos, donde la calidad de las imágenes faciales es relativamente buena. Sin embargo, en imágenes faciales de baja calidad, la precisión de estos modelos disminuye considerablemente. Uno de los modelos mas relevantes en el campo de reconocimiento facial es Arcface, un modelo DCNN que mantiene resultados de precisión entre los 3 primeros puestos en varios conjuntos de datos de referencia relevantes. Para evaluar el rendimiento del modelo de reconocimiento facial en condiciones de baja calidad, entrenamos y probamos extensamente a Arcface en diferentes escenarios de calidad. Observamos que la precisión de Arcface cayó significativamente cuando la calidad de las imágenes faciales se vio comprometida. Para mejorar el rendimiento en imágenes de baja calidad, proponemos varias estrategias de entrenamiento con ajuste fino sobre Arcface. Nuestros resultados muestran mejoras significativas entre
9.71-14.63% al aplicar ajustes finos al modelo. Además, desarrollamos múltiples variaciones de Arcface derivadas de dos enfoques principales: por un lado, entrenamientos con mapas de prominencia autogenerados y, por el otro lado, utilizando bloques de aprendizaje de atención residual (ARL, por sus siglas en inglés) que conforman la columna vertebral del modelo Arcface conocida como ResNet100. Concluimos que los modelos DCNN ya son altamente capaces de discriminar regiones semánticamente relevantes de las imágenes faciales, por lo que el uso de mapas de prominencia o bloques ARL solo mejoran levemente la precisión del modelo en algunos casos particulares en el orden de 0.15% a 0.64%. Para futuros experimentos, presentamos LQ-Faces, el nuevo conjunto de datos de imágenes faciales de baja calidad que ha sido utilizado en nuestro trabajo.

Creator

Buscaglia Hardy, Enzo Maximiliano

Date

2022-11-29T13:40:19Z

2022

Contributor

Mery Quiroz, Domingo

Pontificia Universidad Católica de Chile. Escuela de Ingeniería

Rights

acceso abierto

Format

x, 35 páginas

application/pdf

Language

en

Type

tesis de maestría

Identifier

10.7764/tesisUC/ING/65819

https://doi.org/10.7764/tesisUC/ING/65819

https://repositorio.uc.cl/handle/11534/65819

Saliency maps and attention residual learning for low quality face recognition

Dublin Core

Title

Subject

Description

Creator

Date

Contributor

Rights

Format

Language

Type

Identifier