Aux limites de l’innovation

Le système de reconnaissance faciale de NTechlab est capable d’identifier un visage parmi un milliard de photos

La startup NTechlab a été créée il y a un seulement. Au cours de cette année, elle s’est hissée à la première place du MegaFace Benchmark, championnat international de reconnaissance faciale, et a lancé l’application FindFace, qui permet de rechercher des profils sur vk.com en s’appuyant sur une photographie. NTechlab emploie 20 personnes et gère 300 commandes de clients, ainsi que 30 tests fructueux et une solution cloud. Son fondateur Artem Kukharenko nous a expliqué comment la société a réussi à atteindre son objectif plus efficacement que ses concurrents et à créer un produit qui jouit déjà d’un important succès commercial.

Artem

L’équipe NTechlab a pris l’expression « reconnaître un visage parmi un milliard » au pied de la lettre. En effet, il faut moins d’une seconde pour que son système trouve une personne dans une base de données comportant un milliard de photos. « Nous sommes les premiers à traiter efficacement des banques de photos volumineuses », déclare Artem Kukharenko. « Cet avantage est crucial pour résoudre des problèmes réels, comme trouver un criminel en temps réel ou identifier un client normal sur les caméras de surveillance d’un magasin. »

Outre ses excellentes capacités de recherche, l’algorithme dispose d’un niveau de précision extrêmement élevé pour la reconnaissance. Le secret réside dans l’apprentissage profond (deep learning) et l’architecture des réseaux neuronaux. Artem Kukharenko note que lorsque l’on parle de précision, il faut comprendre comment elle est mesurée. Elle est généralement inférieure avec des bases de données contenant une multitude d’images. En effet, trouver une personne parmi un million s’avère beaucoup plus difficile que d’en trouver une parmi cent. Au championnat MegaFace Benchmark, le système de NTechlab a affiché une précision de 73 % avec une base de données contenant un million de photos et de 95 % avec 10 000 clichés. Pour ce qui est de la vérification (lorsqu’il faut comparer deux photos), le système fonctionne parfaitement dans 99 % des cas.

Le réseau neuronal constitue le cœur et le cerveau du système. Les tâches les plus complexes pour les systèmes d’intelligence artificielle sont celles qu’un cerveau humain traite facilement (par exemple, reconnaître des visages dans une foule ou identifier la race d’un chien). Notre décision est influencée par un million de facteurs et les expériences passées. Les réseaux neuronaux fonctionnent sur le même modèle. Les neurones reçoivent de nombreux signaux mélangés à partir desquels ils forment un signal de sortie. Si le système fait une erreur, la formule responsable de la pondération des signaux d’entrée est corrigée. Ce type d’apprentissage à partir des erreurs améliore la précision.

Cela vous surprendra peut-être, mais quand nous voyons un visage familier, notre cerveau effectue les mêmes calculs qu’une machine. Le système reçoit l’image originale, par exemple une photo d’un passant chargée dans FindFace.
Le système reçoit l’image originale, par exemple une photo d’un passant chargée dans FindFace.
Dans un premier temps, un visage est immédiatement identifié sur ce cliché. Selon Artem Kukharenko, la reconnaissance faciale représente l’opération qui exige le plus de ressources de tout le processus, aussi étrange que cela puisse paraître. L’équipe cherche actuellement des moyens de faire travailler l’algorithme plus vite avec moins de ressources.

La deuxième étape de la reconnaissance implique la construction d’un vecteur de caractéristiques en utilisant un réseau neuronal formé. Ce vecteur se compose de 80 chiffres qui contiennent des informations sur le visage. Les chiffres sont similaires pour une même personne et très différents entre deux personnes. Le système de recherche se base sur ces différences. À cette étape, le système doit identifier les informations qui ne changent pas même si une personne met des lunettes, se laisse pousser la barbe ou si plusieurs années séparent les deux photos.

La dernière étape inclut la recherche de ce « visage » dans la banque d’images. Pour les différents calculs et études visant à créer un algorithme de recherche, l’équipe de développeurs de NTechlab a eu besoin de stations de travail efficaces. Elle a opté pour des processeurs Intel® Core™ i7, grâce auxquels elle a pu créer un outil fiable permettant d’effectuer des recherches dans un grand nombre de photos. Si la taille de la base de données augmente de dix fois, le temps de recherche n’est pas décuplé, mais rallonge de 1,5 fois seulement.

Ce système possède une gamme impressionnante d’applications qui peuvent aller des sites de rencontre amusants aux systèmes de sécurité gouvernementaux. Les produits développés par NTechlab se démarquent dans le secteur stratégique de la sécurité. Les systèmes existants permettent de comparer deux photos, par exemple celle de votre passeport et celle de la base de données à l’aéroport. Ils ne sont néanmoins pas suffisants pour garantir la sécurité à l’échelle d’une ville. La solution de NTechlab est capable de traiter des informations provenant de milliers de caméras de surveillance en temps réel et de trouver des criminels dans une immense mégalopole.

Dans le secteur de la grande distribution, ce système pourrait remplacer les cartes de fidélité, simplement en enregistrant le vecteur de caractéristiques du client à l’aide de sa photo. La prochaine fois qu’il pénètrera dans le centre commercial, la caméra de surveillance reconnaîtra son visage. Outre l’aspect pratique, cette solution résout le problème du stockage des données personnelles, puisque les boutiques n’auront plus besoin de demander les noms et numéros de téléphone des clients.

Le secteur du divertissement a mis en place des systèmes qui recherchent des visiteurs dans des banques d’images. Les visiteurs prennent des selfies et les envoient à un bot, qui renvoie ensuite toutes les images sur lesquelles ils se trouvent. Ce système convient aux festivals, mariages et autres manifestations. Artem Kukharenko précise qu’il a déjà connu un franc succès à l’occasion de l’Alfa Future People Festival et dans un parc d’attraction australien.

7а

NTechlab, qui ne compte pas se reposer sur ses lauriers après des débuts prometteurs, a déjà lancé un service de reconnaissance faciale basé sur le cloud. N’importe quelle entreprise peut charger une banque d’images dans le système pour lancer des recherches, mais également l’intégrer à ses propres services. Un kit de développement logiciel (SDK) sera bientôt proposé aux développeurs tiers. Dans quelques mois, la reconnaissance faciale des systèmes de sécurité des usines s’effectuera en ligne.

NTechlab travaille actuellement sur l’optimisation de l’algorithme et sur l’amélioration de la précision. L’objectif consiste à reconnaître les émotions sur des photographies et à développer un module qui permettrait à la machine de faire la différence entre une personne réelle et sa photo. Pour réussir, l’intelligence artificielle doit évoluer constamment.

Partager cet article

Thèmes associés

Innovation technologique

Lire ensuite