Détection de visage
From Wikipedia, the free encyclopedia

La détection de visage est un domaine de la vision par ordinateur consistant à détecter un visage humain dans une image numérique. C'est un cas spécifique de détection d'objet, où l'on cherche à détecter la présence et la localisation précise d'un ou plusieurs visages dans une image. C'est l'un des domaines de la vision par ordinateur parmi les plus étudiés, avec de très nombreuses publications, brevets, et de conférences spécialisées. La forte activité de recherche en détection de visage a également permis de faire émerger des méthodes génériques de détection d'objet.
La détection de visage a de très nombreuses applications directes en vidéo-surveillance, biométrie, robotique, commande d'interface homme-machine, photographie, indexation d'images et de vidéos, recherche d'images par le contenu, etc. Elle permet également de faciliter l'automatisation complète d'autres processus comme la reconnaissance de visage ou la reconnaissance d'expressions faciales.
La détection de visage cherche à détecter la présence et la localisation précise d'un ou plusieurs visages dans une image numérique ou une vidéo. C'est un sujet difficile, notamment dû à la grande variabilité d'apparence des visages dans des conditions non contraintes:
- Variabilité intrinsèque des visages humains (couleur, taille, forme)
- Présence ou absence de caractéristiques particulières (cheveux, moustache, barbe, lunettes…)
- Expressions faciales modifiant la géométrie du visage
- Occultation par d'autres objets ou d'autres visages
- Orientation et pose (de face, de profil)
- Conditions d'illumination et qualité de l'image
- Présence de photos de visages qui seront prises comme des visages de personnes présentes.
La détection de visage doit faire face à une forte variabilité intra-classe, et la plupart des méthodes de détection d'objet destinées aux objets rigides ne sont pas adaptées[1].
Historique
Les premiers essais datent du début des années 1970, et sont basés sur des méthodes à bases d'heuristiques. Ces méthodes sont très peu robustes, car elles font de nombreuses suppositions en se plaçant dans des cas très simples (visage de face, bonnes conditions d'illuminations, etc.)[2]. La recherche et les premières méthodes significatives se développent surtout à partir des années 1990[2]. L'augmentation de la puissance de calcul des ordinateurs permet notamment l'utilisation de méthodes statistiques et d'apprentissage plus complexes et sur de plus gros volumes de données, ce qui permet un net gain de performance. Elle est particulièrement importante car elle se distingue des précédentes méthodes de détection d'objet, auparavant limitées aux objets rigides, et donc avec moins de variabilité[1].
Un pas important est franchi en 2001 avec la publication de la méthode de Viola et Jones, la première méthode capable de détecter des visages en temps-réel. La méthode devient standard et est reprise et améliorée par de nombreux chercheurs[3]. C'est également à partir des années 2000 que les méthodes basées apparence, qui apprennent des modèles de visage à partir d'un ensemble d'images d'apprentissage, se révèlent généralement supérieures aux autres types d'approches[3].
Techniques de détection
Performances
Extensions
Reconnaissance de visage, reconnaissance d'expressions