Skip to content. | Skip to navigation

Emergences

Lettre d'information n° 11

Image emergences pour impression
Personal tools
You are here: Home 2010 Lettre d'information n° 11 Les grandes bases d'images passées au crible
Document Actions

Les grandes bases d'images passées au crible

Au centre Inria Rennes - Bretagne Atlantique, le chercheur Inria Hervé Jégou explore de nouvelles techniques pour accélérer la recherche et la comparaison d'images. A la clé : la détection automatique de vidéos piratées.

Au centre Inria Rennes - Bretagne Atlantique, le chercheur Inria Hervé Jégou explore de nouvelles techniques pour accélérer la recherche et la comparaison d'images. A la clé : la détection automatique de vidéos piratées.

A chaque minute qui passe, les internautes envoient l'équivalent de 24 heures de programmes sur YouTube.  Le site de partage vidéo le plus populaire de la planète héberge désormais des centaines de millions de fichiers. Mais dans pareille pléthore de pixels, comment un éditeur peut-il vérifier que personne n'empiète sur son copyright ? Que des oeuvres ne sont pas publiées à son insu ? "Ce n'est pas un opérateur humain qui va pouvoir visualiser les images une par une pour déterminer si ce sont des copies légitimes", répond Hervé Jégou. Membre de l'équipe de recherche Texmex (1), à l'Inria Rennes - Bretagne Atlantique, le scientifique développe actuellement une méthode de comparaison d'images qui pourrait permettre d'automatiser plus efficacement ce type de vérification massive.

"Tout d'abord, il faut bien comprendre que le but n'est pas de faire apparaître des images à partir de mots clés. Nous ne faisons pas d'analyse sémantique. Nous ne cherchons pas à savoir ce que représente une photo. Notre objectif est de comparer une image à une autre."  Ou plus exactement... à 10 millions d'autres, ce qui correspond à la taille de notre photothèque utilisée pour ces expériences. "Nous nous intéressons à la recherche dans de très grandes bases, photos ou vidéos."  En 2008, une première version de ces travaux a démontré la très grande rapidité de la méthode par rapport à d'autres, lors d'une rencontre internationale où elle s'est classée première.

Muraille de Chine, Golden Gate ou Tour Eiffel, le système reçoit une image cible. En quelques instants, il va être capable  d'identifier toutes les photos présentant une ressemblance. "Tous les calculs sont effectués à la volée." Comment est-ce possible ? "Grâce à une description mathématique préalable." Passée au crible, chaque photo fait l'objet d'une représentation par descripteurs. "Nous stockons environ 2 000 vecteurs qui caractérisent des petites zones de l'image. De cette façon, le problème devient extrêmement bien posé. Il se réduit à une simple comparaison de vecteurs et de distances euclidiennes dans différentes images."

Comparaison de vecteurs

A ce stade pourtant, un problème demeure : le coût du calcul. "Comparer deux images nécessite environ 5 x 108 opérations. Pour notre base de 10 millions de photos, il faut multiplier par... 107 ! Tout cela, sachant que nous visons plutôt des bases d'un milliard de fichiers. Donc, très vite on s'achemine vers le petaflop." Un million de milliards d'opérations par seconde. "Or, on ne peut pas mobiliser tous les ordinateurs de la planète pour ce travail. Nous nous efforçons donc de réduire ce coût de calcul. Il faut enlever disons... 6 ordres de grandeur."

Compression de descripteurs

C'est ici que se situe la nouveauté dans ces recherches. "Nous introduisons la compression des descripteurs. Nous pensons que la comparaison de distances peut être accélérée par les techniques de compression. Nous comparons notre  photo non plus aux vecteurs de 10 millions d'images mais à la représentation compressée de ces vecteurs. Cette signature très compacte décrit le contenu de l'image de façon moins précise, certes, mais elle tient dans 20 à 40 octets. Et cela fait une énorme différence. La recherche s'avère un peu moins bonne, mais notre dernière version parvient à des retours en 14 millisecondes, et cela sur un simple ordinateur portable." Le gain de performance permet aussi de traiter maintenant les bases de 100 millions d'images. Ces travaux intéressent en particulier des entreprises avec qui les chercheurs de l'Inria collaborent dans le cadre du programme Quaero.

 ----

Notes :

(1) Texmex : équipe-projet Inria commune avec Rennes 1, l'Insa de Rennes et le CNRS, dirigée par Patrick Gros, chercheur Inria. Techniques d'exploitation des documents multimédias - Exploration, indexation, navigation et recherche dans de très grandes bases.