EDI_84_Entier_Web_opti - EDI_84_P072_G_DOSS_VS_DEEPLEARNING

EDI_84_Entier_Web_optiEDI_84_Entier_Web_opti - EDI_84_P072_G_DOSS_VS_DEEPLEARNING_BAT Dossier par Frédéric Monflier L’AUTOAPPRENTISSAGE S’INSTRUIT DOUCEMENT Le deep learning promet d’améliorer ou l’identification de L’intelligence artificielle n’est certes pas une nouveauté dans les applications liées à l’analyse d’image telle la vidéosurveilla Mais, depuis trois ans environ, elle mobilise à nouveau en raison de l’avènement de l’apprentissage approfondi, ou deep learning. Cette technique est un sous-ensemble de l’autoapprentissage (machine learning), grâce à laquelle l’IA apprend par l’exemple et se perfectionne en continu. la plupart du temps sur des de neurones virtuels, organisés de façon à simuler les fonctions cognitives humaines. Théorisé dans les années 1980, le deep learning n’est plus entravé par l’insuffisance de la puissance de calcul et de la quantité de données nécessaires à son accomplissement. La lecture automatique des plaques d’immatriculation commence à en tirer profit. « Depuis douze ans, le machine learning aide à traiter l’image et à repérer les plaques, mais les performances ont fini par plafonne exlir,pque Paule Brodeur, responsable du groupe Computer Vision chez Genetec qui fabrique les caméras AutoVu. Nous avons ensuite intégré du deep learning dans quelques blocs d’algorithme, faute de pouvoir le faire en totalité à cause de la puissance limitée des caméras. D’un coup, les performances ont bondi de 5%. » Dans d’autres métiers, comme la détection d’intrusion, il demeure expérimental mais s’annonce prometteur. « Les algorithmes différencient les silhouettes d’apparence humaine et tout lereste, schématise Jean- Baptiste Ducatez, dirigeant de Foxstream, société qui travaille sur le sujet depuis deux ans en lien 72 E.D.I N°84 | décembre 2018 VidéosurveillanceDeep learning sensiblement la détection d’objets personnes. Mais sa fiabilité est perfectible. nce. l’attention Elle repose réseaux allongé, accroupi, ou coiffé ces algorithmes au point qu’ils d’un chapeau, etc. « Or, s’il est simple fonctionnent en temps réel sur de récupérer un million d’images des supports moins puissants, avec le CNRS. Avec ledeep learning, de chats sur Internet, c’est beaucoup donc moins onéreux. Jusque dans le nombre de catégories d’objets plus compliqué pourdes scènes la caméra elle-même ? Genetec explose. Non seulement la de délits ou de crimes », précise prévoit d’implanter des GPU dans classification s’affine mais la poréte Jean-Baptiste Ducatez chez ses nouveaux modèles AutoVu de la détection augmente. » Un gain Foxstream. La puissance requise dès 2019. Les « petits » CPU de précision qui devrait bénéficier pour le traitement de ces images industrialisés massivement aussi à la gestion de flux, à est le second écueil. Si le cloud pour les caméras classiques l’identification faciale, à la détection et sa cohorte d’accélérateurs GPU n’ont pas la même étoffe. Enfin, de bagages abandonnés sont mis à contribution pendant le deep learning est considéré ou de comportements anormaux... l’entraînement, ils ne sont pas comme une boîte noire, dont Plusieurs problématiques toujours envisageables en vitesse le fonctionnement obscur rebute sont néanmoins à résoudre, de croisière. « Dans une grande parfois les clients. Et ses résultats à commencer par l’acquisition infrastructure de transport, parfois aberrants – même rares – de banques d’images appropriées. on devrait analyser à chaque seconde incitent à la prudence. « Des erreurs 30 images de 8 Mpx, à multiplier d’interprétation flagrantes ne sont pas Amener les algorithmes par 5 000 caméras. Le cloud coûterait tolérables dans le domaine de la à fonctionnr en temps réele des dizaines de millions d’euros sécurité, rappelle Jean-Baptiste Ces algorithmes réclament une par mois ! », détaille William Eldin, Ducatez chez Foxstream. Le travail longue phase d’entraînement initial, P.-D.G. de la startup XXII, focalisée de recherche et les phases de pendant laquelle ils assimilent sur les applications de sécurité validation doivent continuer pour des quantités colossales de données et d’identification de produits fiabiliser les algorithmes. » De fait, annotées. Dans le contexte dans le commerce. Chez sa dizaine les docteurs en IA s’arrachent dans de la vision par ordinateur, l’objectif de clients, elle a opté pour des la filière. Ces talents et les banques est, par exemple, d’apprendre serveurs locaux équipés de cartes d’images les plus pertinentes à l’IA à distinguer un être humain, Nvidia, qui coûtent « entre 50 K€ vont valoir leur pesant d’or. ■ et 200 K€ ». C’est l’enjeu de cette phase dite d’inférence, suivant la phase d’entraînement : dégrossir Suite du dossier p. 74 - janvier 2019