Skip to content. | Skip to navigation

Emergences

Lettre d'information n° 32

Image emergences pour impression
Personal tools
You are here: Home 2014 Lettre d'information n° 32 Un outil pour fouiller plus vite les disques durs saisis
Document Actions

Un outil pour fouiller plus vite les disques durs saisis

Deux PME, l'une en Islande, l'autre au Royaume Uni travaillent avec Inria dans le cadre d'un projet européen visant à développer des outils de vision par ordinateur pour aider les services de police à traquer les vidéos de propagande terroriste et les contenus pédopornographiques. Ces outils conservent une mémoire visuelle de toutes les images qu'ils analysent. Ils peuvent ensuite repérer automatiquement des contenus visuellement similaires. Comme l'explique Laurent Amsaleg, chercheur au CNRS, la comparaison rapide de millions d'empreintes visuelles constituait le défi scientifique au cœur de ce partenariat.

Deux PME, l'une en Islande, l'autre au Royaume Uni travaillent avec Inria dans le cadre d'un projet européen visant à développer des outils de vision par ordinateur pour aider les services de police à traquer les vidéos de propagande terroriste et les contenus pédopornographiques. Ces outils conservent une mémoire visuelle de toutes les images qu'ils analysent. Ils peuvent ensuite repérer automatiquement des contenus visuellement similaires. Comme l'explique Laurent Amsaleg, chercheur au CNRS, la comparaison rapide de millions d'empreintes visuelles constituait le défi scientifique au cœur de ce partenariat.

À chaque fois que la police saisit des images téléchargées ou produites par des pédophiles,  pour les enquêteurs commence un travail fastidieux et éprouvant : l'examen et le classement de tous ces contenus. Il faut fouiller les disques durs saisis dans les ordinateurs du suspects mais aussi le web où d'autres contenus peuvent être entreposés. Ce qui revient à chercher une aiguille dans une énorme botte de foin. Ce passage au crible dure une éternité et mobilise des policiers dont le temps pourrait être mieux employé.

Jeune entreprise implantée à Reykjavík, en Islande, Videntifier Technologies commercialise une suite d'outils numériques d'investigation criminelle conçue précisément pour décharger les forces de police de ce travail manuel souvent stressant et ô combien chronophage. Les logiciels en question mémorisent le contenu visuel des vidéos et photos qu'ils explorent. Ils parviendront ensuite à identifier automatiquement toutes les autres occurrences des mêmes contenus parmi les données qu'ils analyseront. Cette capacité peut permettre de faire le lien entre plusieurs affaires, d'identifier des modes de distribution, mais aussi de faciliter l'échange d'informations entre différentes polices.

Interpol très intéressé


Cette solution intéresse vivement Interpol. L'agence prévoit de l'utiliser en conjonction avec sa base de données internationale sur l'exploitation sexuelle des enfants (ICSE). La base fournit des renseignements aux polices du monde entier sur tous les contenus qui ont été référencés. Les enquêteurs y répertorient également leurs nouvelles découvertes. En interrogeant ICSE, ils peuvent comparer des contenus, faire le lien entre des éléments de preuve anciens et de nouvelles images, contribuant ainsi à confondre des pédophiles et à sauver des enfants. Aux Etats-Unis, le National Center of Missing and Exploited Children (NCMEC) a fait également l'acquisition de cette technologie pour le même usage.

Ces innovations résultent d'un travail de recherche scientifique auquel le centre Inria Rennes - Bretagne Atlantique a été étroitement associé par le biais de l'équipe projet Texmex (1) et plus précisément du chercheur Laurent Amsaleg. “J'ai fait la connaissance d'un collègue islandais il y a des années, durant mon post-doc aux Etats-Unis. Nous partagions le même intérêt pour la gestion de vastes collections d'images fixes. De retour dans nos pays respectifs, nous en avons fait chacun notre thème de recherche.” Et c'est ainsi qu'a débuté une collaboration scientifique avec l'université de Reykjavík.

Fouiller de très grandes bases


La technologie au cœur de cette saga ne repose en rien sur l'utilisation de mots ou des descriptions textuelles. En entrée, le logiciel se nourrit de représentations mathématiques des images : des vecteurs de grande dimension qui décrivent le contenu. Ces vecteurs permettent de comparer visuellement une image à d'autres. Mais à combien d'autres ? C'est là toute la question. Car pour que ce système soit d'une quelconque utilité, il lui faut quelque-chose en plus : un moyen de parcourir efficacement de très grosses collections d'images. “Vers 2007, nous sommes parvenus à mettre au point un algorithme capable de trouver une image parmi un million d'autres en l'espace de quelques secondes. L'année suivante, ces travaux ont amené deux étudiants islandais de thèse à fonder l'entreprise Videntifier. Au début, ils développaient des logiciels pour aider les ayants droits à détecter d'éventuelles violations de copyrights sur Internet. Au bout d'un moment, ils se sont aperçu que la même technologie pouvait servir aux forces de l'ordre dans le cadre des investigations numériques liées au crime.

Le nouveau produit permet aux services de police de classer des contenus vidéo et de comparer des images à une base de données d'empreintes visuelles. “Des agences comme Interpol, le NCMCE, ou le département américain du Homeland Security ont accumulé des millions de photos et de vidéos pédopornographiques. D'aussi grandes bases de données reposent sur des dizaines de milliards d'empreintes visuelles. Et le logiciel est capable de gérer une telle masse. Globalement, les vidéos relèvent de trois catégories : images ordinaires, films sous copyright et contenus criminels. En l'occurrence, ici, nous ne nous intéressons qu'à cette dernière catégorie. Nous ne sommes pas en train de chercher une version piratée d'Avatar. Mais si nous en trouvons une, nous stockons son empreinte visuelle dans la base de données. Ainsi, la prochaine fois que le logiciel tombera sur ce film, il saura automatiquement le reconnaître et ne perdra pas de temps avec cela.

La nouvelle phase de transfert bénéficie du soutien d'Eureka, l'organisation européenne en charge du programme Eurostars. Conçu pour les PME, ce dispositif finance les projets d'innovation transnationaux afin de faciliter l'émergence de nouveaux produits et services. Dans cette collaboration tripartite, Inria et Videntifier sont rejoints par Forensic Pathways, une entreprise britannique dont la dernière technologie est capable d'établir si plusieurs vidéos ont été filmées par la même caméra, y compris quand les personnes et les lieux qui y figurent sont différents. “Cela permet aux enquêteurs de faire le lien entre plusieurs affaires où différents enfants sont victimes du même prédateur, ou encore de prouver devant un tribunal que le détenteur de telle image n'est pas ‘seulement’ un téléchargeur mais bien celui qui a perpétré les actes incriminés.

Repérer des logos d'organisations terroristes


Un aspect particulier des recherches conduites actuellement à l'Inria porte sur l'identification de logos. Maître de conférences à l'Université de Rennes 1, Ewa Kijak travaille sur ces aspects. “La plupart du temps, les vidéos publiées par des groupes terroristes comportent un emblème quelconque qui indique de quelle organisation le film provient. Les forces de l'ordre souhaitent disposer d'une application qui détecterait automatiquement ces symboles. Mais cela n'existe pas encore. Il se trouve que notre expertise en reconnaissance automatique d'images permettait précisément de répondre à cette demande. Cette technologie prendra la forme d'un outil supplémentaire dans la suite logicielle Videntifier Forensic.

Salué comme une réussite par Eureka, le projet arrive à son terme cet été. Inria a recruté un ingénieur (2) pour intégrer les résultats de recherche dans l'application finale. “Nous livrons un logiciel prêt à l'emploi,” conclut Laurent Amsaleg.

------
Notes :
(1) Située à Rennes, Texmex  est une équipe projet Inria, CNRS, Université de Rennes 1 et Insa Rennes, commune à l'Irisa (UMR 6074).
(2) Arthur Masson.