Dossier VidéosurveillanceDeep learning par Frédéric Monflier L’AUTOAPPRENTISSAGE S’INSTRUIT DOUCEMENT Le deep learning promet d’améliorer sensiblement la détection d’objets ou l’identification de personnes. Mais sa fiabilité est perfectible. L’intelligence artificielle n’est certes pas une nouveauté dans les applications liées à l’analyse d’image telle la vidéosurveillance. Mais, depuis trois ans environ, elle mobilise à nouveau l’attention en raison de l’avènement de l’apprentissage approfondi, ou deep learning. Cette technique est un sous-ensemble de l’autoapprentissage (machine learning), grâce à laquelle l’IA apprend par l’exemple et se perfectionne en continu. Elle repose la plupart du temps sur des réseaux de neurones virtuels, organisés de façon à simuler les fonctions cognitives humaines. Théorisé dans allongé, accroupi, ou coiffé ces algorithmes au point qu’ils les années 1980, le deep learning d’un chapeau, etc. « Or, s’il est simple fonctionnent en temps réel sur n’est plus entravé par l’insuffisance de récupérer un million d’images des supports moins puissants, de la puissance de calcul et de la avec le CNRS. Avec ledeep learning, de chats sur Internet, c’est beaucoup donc moins onéreux. Jusque dans quantité de données nécessaires le nombre de catégories d’objets plus compliqué pourdes scènes la caméra elle-même ? Genetec à son accomplissement. explose. Non seulement la de délits ou de crimes », précise prévoit d’implanter des GPU dans La lecture automatique des plaques classification s’affine mais la poréte Jean-Baptiste Ducatez chez ses nouveaux modèles AutoVu d’immatriculation commence de la détection augmente. » Un gain Foxstream. La puissance requise dès 2019. Les « petits » CPU à en tirer profit. « Depuis douze ans, de précision qui devrait bénéficier pour le traitement de ces images industrialisés massivement le machine learning aide à traiter aussi à la gestion de flux, à est le second écueil. Si le cloud pour les caméras classiques l’image et à repérer les plaques, l’identification faciale, à la détection et sa cohorte d’accélérateurs GPU n’ont pas la même étoffe. Enfin, mais les performances ont fini par de bagages abandonnés sont mis à contribution pendant le deep learning est considéré plafonne exlir,pque Paule Brodeur, ou de comportements anormaux... l’entraînement, ils ne sont pas comme une boîte noire, dont responsable du groupe Computer Plusieurs problématiques toujours envisageables en vitesse le fonctionnement obscur rebute Vision chez Genetec qui fabrique sont néanmoins à résoudre, de croisière. « Dans une grande parfois les clients. Et ses résultats les caméras AutoVu. Nous avons à commencer par l’acquisition infrastructure de transport, parfois aberrants – même rares – ensuite intégré du deep learning dans de banques d’images appropriées. on devrait analyser à chaque seconde incitent à la prudence. « Des erreurs quelques blocs d’algorithme, faute 30 images de 8 Mpx, à multiplier d’interprétation flagrantes ne sont pas de pouvoir le faire en totalité à cause Amener les algorithmes par 5 000 caméras. Le cloud coûterait tolérables dans le domaine de la de la puissance limitée des caméras. à fonctionnr en temps réele des dizaines de millions d’euros sécurité, rappelle Jean-Baptiste D’un coup, les performances ont bondi Ces algorithmes réclament une par mois ! », détaille William Eldin, Ducatez chez Foxstream. Le travail de 5%. » Dans d’autres métiers, longue phase d’entraînement initial, P.-D.G. de la startup XXII, focalisée de recherche et les phases de comme la détection d’intrusion, pendant laquelle ils assimilent sur les applications de sécurité validation doivent continuer pour il demeure expérimental des quantités colossales de données et d’identification de produits fiabiliser les algorithmes. » De fait, mais s’annonce prometteur. annotées. Dans le contexte dans le commerce. Chez sa dizaine les docteurs en IA s’arrachent dans « Les algorithmes différencient de la vision par ordinateur, l’objectif de clients, elle a opté pour des la filière. Ces talents et les banques les silhouettes d’apparence humaine est, par exemple, d’apprendre serveurs locaux équipés de cartes d’images les plus pertinentes et tout lereste, schématise Jean- à l’IA à distinguer un être humain, Nvidia, qui coûtent « entre 50 K€ vont valoir leur pesant d’or. ■ Baptiste Ducatez, dirigeant et 200 K€ ». C’est l’enjeu de cette de Foxstream, société qui travaille phase dite d’inférence, suivant sur le sujet depuis deux ans en lien la phase d’entraînement : dégrossir Suite du dossier p. 74 72 E.D.I N°84 | décembre 2018 - janvier 2019