ACTUALITÉ SCIENTIFIQUE
ET INNOVATION DE L'ÉTS
Une nouvelle intelligence artificielle de reconnaissance faciale - Par : Hanen Hattab,

Une nouvelle intelligence artificielle de reconnaissance faciale


Hanen Hattab
Hanen Hattab est doctorante en sémiologie à l’UQAM. Ses recherches portent sur les pratiques d’art et de design subversifs et contre culturels comme le vandalisme artistique, le sabotage et les détournements culturels.

Comme RoboCop, nous aurons peut-être prochainement la capacité d’identifier rapidement les visages dans une foule. Un article intitulé « View-Tolerant Face Recognition and Hebbian Learning Imply Mirror-Symmetric Neural Tuning to Head Orientation », rédigé par Joe Z. Leibo, Qianli Liao, Fabio Anselmi, Winrich Freiwald et Tomaso Poggio (des chercheurs du Massachussetts Institute of Technology (MIT)), et publié le 1er décembre 2016 par le journal Current Biology, présente un modèle computationnel du mécanisme humain de reconnaissance faciale.

Les chercheurs ont conçu un système d’apprentissage qui s’inspire d’un modèle neurologique du traitement des informations visuelles. Ils l’ont entraîné à reconnaître des visages particuliers en lui fournissant une banque d’images. Ils ont constaté que le système a intégré une étape de traitement intermédiaire, non intégrée au préalable, qui a émergé spontanément du processus d’apprentissage, et qui est maintenant capable de se représenter un visage tourné d’environ 45o degrés par rapport au centre, indépendamment de la direction ( gauche ou droite).

Le cadre transdisciplinaire de l’expérience

Cette étape, initialement non prévue, imite une caractéristique qui a été expérimentalement observée dans le mécanisme de traitement des faces des primates. Les chercheurs considèrent cela comme une indication que leur système et le cerveau suivent les mêmes processus. Tomaso Poggio, professeur des sciences cognitives et du cerveau au MIT et directeur du Centre cerveaux, esprits et machines (CBMM), souligne que les modèles conçus à partir de systèmes biologiques ne sont qu’une sorte de caricature (stylisation) de la réalité et qu’il est difficile de déduire scientifiquement quoi que ce soit à partir de la réaction émergente du processus d’apprentissage. Par ailleurs, le nouvel article rédigé par les chercheurs la preuve mathématique que ce type particulier de système d’apprentissage machine, destiné à offrir ce que Poggio appelle un modèle « biologiquement plausible » du système nerveux, produira inévitablement d’autres représentations intermédiaires.

Poggio remarque que le dernier article témoigne des portées épistémologiques de leurs recherches. D’une part, l’intégration de l’apprentissage machine et de l’informatique et d’autre part, l’approfondissement des connaissances sur la cognition des primates à partir de la neurophysiologie. En effet, leurs recherches au sein du CBMM portent aussi sur les « algorithmes » que le cerveau utilise et sur les circuits neurophysiologiques qui les mettent en œuvre.

Comment fonctionne la reconnaissance faciale chez les primates?

Poggio croit depuis longtemps que le cerveau produit des représentations « invariantes » des visages et des autres objets, c’est-à-dire des représentations indépendantes de l’orientation des objets dans l’espace, de leur distance par rapport à l’observateur ou de leur emplacement dans le champ visuel. La capacité du cerveau à traduire les informations visuelles des objets isolés en éliminant ces variables spatiales a fait l’objet de l’article « The Invariance Hypothesis Implies Domain-Specific Regions in Visual Cortex » publié aussi dans le Journal Computational Biology en octobre 2015. Les scintigraphies par résonance magnétique effectuées sur des cerveaux humains et de singes le suggèrent aussi. En effet, en 2010, Freiwald a publié une étude détaillée décrivant la neuro-anatomie du mécanisme de reconnaissance faciale des singes macaques. Il a montré que l’information provenant des nerfs optiques du singe traverse une série d’emplacements cérébraux, dont la réaction diffère selon l’orientation du visage observé. Les neurones de la première région ne se déclenchent qu’en réponse à certaines orientations particulières du visage. Les neurones de la dernière région fonctionnent indépendamment de l’orientation (la représentation invariante).

Par ailleurs, les neurones d’une région intermédiaire semblent être « symétriques  »: ils sont sensibles à l’angle de rotation du visage sans égard à la direction (gauche ou droite) : un groupe de neurones se déclenche lorsque le visage est positionné à 45o vers la gauche, et l’autre s’excite quand il est positionné à 45o vers la droite. Les trois régions se trouvent à l’intérieure de l’aire du visage dans le cortex visuel.

reconnaissance faciale

Région de la reconnaissance faciale dans le cortex visuel

Intégration du concept de Hebb dans le système

Le système d’apprentissage automatique des chercheurs est appelé réseau de neurones parce qu’il s’approche grossièrement de l’architecture du cerveau humain. La première machine a été entraînée à produire des représentations invariantes en mémorisant des orientations de quelques visages modèles. Poggio était insatisfait du résultat parce qu’il n’était pas tout à fait semblable au fonctionnement neurophysiologique du cerveau. Pour l’améliorer, il a intégré à une nouvelle machine le concept de Hebb. En gros, il s’agit de créer des stimulations continuelles entre les modules connectés de la machine, à l’instar de ce qui se passe entre les neurones, pour améliorer leur fonction mnésique et optimiser le traitement des informations. Cette approche a généré comme prévu des représentations invariantes. De plus, comme mentionné plus haut, des couches du réseau ont simulé spontanément les réponses miroir-symétriques des régions intermédiaires du traitement visuel du cerveau.

 

Hanen Hattab

Profil de l'auteur(e)

Hanen Hattab est doctorante en sémiologie à l’UQAM. Ses recherches portent sur les pratiques d’art et de design subversifs et contre culturels comme le vandalisme artistique, le sabotage et les détournements culturels.

Profil de l'auteur(e)