Caras maestras» que pueden eludir más del 40% de los sistemas de autentificación facial

Investigadores de Israel han desarrollado una red neuronal capaz de generar caras «maestras», es decir, imágenes faciales capaces de suplantar varias identidades. El trabajo sugiere que es posible generar esas «claves maestras» para más del 40% de la población utilizando sólo 9 rostros sintetizados por la red adversarial generativa StyleGAN (GAN), a través de tres sistemas líderes de reconocimiento facial.

El trabajo es fruto de la colaboración entre la Escuela de Informática Blavatnik y la Escuela de Ingeniería Eléctrica, ambas de Tel Aviv.

Al probar el sistema, los investigadores descubrieron que un solo rostro generado podía desbloquear el 20% de todas las identidades de la base de datos de código abierto Labeled Faces in the Wild (LFW) de la Universidad de Massachusetts, un repositorio común utilizado para el desarrollo y la prueba de sistemas de identificación facial, y la base de datos de referencia para el sistema israelí.

El flujo de trabajo del sistema israelí, que utiliza el generador StyleGAN para buscar iterativamente «rostros maestros». Fuente: https://arxiv.org/pdf/2108.01077.pdf

El flujo de trabajo del sistema israelí, que utiliza el generador StyleGAN para buscar iterativamente «caras maestras». Fuente: https://arxiv.org/pdf/2108.01077.pdf

El nuevo método mejora un trabajo reciente similar de la Universidad de Siena, que requiere un nivel de acceso privilegiado al marco de aprendizaje automático. En cambio, el nuevo método infiere rasgos generalizados a partir de material disponible públicamente y lo utiliza para crear características faciales que abarcan un gran número de identidades.

Evolución de los rostros maestros

StyleGAN se utiliza inicialmente en este enfoque bajo un método de optimización de caja negra centrado (como es lógico) en datos de alta dimensión, ya que es importante encontrar los rasgos faciales más amplios y generalizados que satisfagan un sistema de autenticación.

Este proceso se repite de forma iterativa para abarcar las identidades que no se codificaron en la pasada inicial. En diferentes condiciones de prueba, los investigadores comprobaron que era posible obtener la autentificación del 40-60% con sólo nueve imágenes generadas.

Grupos sucesivos de «rostros maestros» obtenidos en la investigación a través de varios métodos de búsqueda de cobertura, incluido LM-MA-ES. La cobertura media del conjunto (MSC, una métrica de precisión) se anota bajo cada imagen.

Grupos sucesivos de «rostros maestros» obtenidos en la investigación a través de varios métodos de Búsqueda de Cobertura, incluyendo LM-MA-ES. La cobertura media del conjunto (MSC, una métrica de precisión) se anota bajo cada imagen.

El sistema utiliza un algoritmo evolutivo acoplado a un predictor neural que estima la probabilidad del ‘candidato’ actual de generalizar mejor que el p-percentil de los candidatos generados en pases anteriores.

El filtrado de los candidatos generados en la arquitectura del sistema israelí.

El filtrado de los candidatos generados en la arquitectura del sistema israelí.

LM-MA-ES

El proyecto utiliza el algoritmo de Adaptación Matricial de Memoria Limitada (LM-MA-ES) desarrollado para una iniciativa de 2017 dirigida por el Grupo de Investigación sobre Aprendizaje Automático para el Diseño de Algoritmos Automatizados, un enfoque que es muy adecuado para la optimización de cajas negras de alta dimensión.

El LM-MA-ES produce candidatos al azar. Aunque esto es adecuado para el objetivo del proyecto, se necesita un componente adicional para deducir qué rostros son los mejores candidatos para la autenticación de identidades cruzadas. Por ello, los investigadores crearon un clasificador neural «Predictor de éxito» para cribar la avalancha de candidatos en las caras más adecuadas para la tarea.

Justificación del predictor de éxito utilizado en el proyecto israelí de falsificación de identidades faciales.

Justificación del Predictor de Éxito utilizado en el proyecto israelí de suplantación de identidad facial.

Evaluación

El sistema se probó con tres descriptores faciales basados en CNN: SphereFace, FaceNet y Dlib, cada arquitectura del sistema contiene una métrica de similitud y una función de pérdida, que son útiles para validar las puntuaciones de precisión del sistema.

El Predictor de Éxito es una red neuronal de avance que consta de tres capas totalmente conectadas. La primera de ellas utiliza la regularización BatchNorm para garantizar la coherencia de los datos antes de la activación. La red utiliza ADAM como optimizador, con una ambiciosa tasa de aprendizaje de 0,001 sobre lotes de 32 imágenes de entrada.

Resultados de las tres arquitecturas.

Resultados de las tres arquitecturas.

Los tres algoritmos probados fueron entrenados para 26.400 llamadas a la función de aptitud utilizando el mismo conjunto de cinco semillas.

*** Translated with http://www.DeepL.com/Translator (free version) ***

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s

Crea tu sitio web con WordPress.com
Comenzar
A %d blogueros les gusta esto: