Skip to content. | Skip to navigation

Emergences

Lettre d'information n° 06

Image emergences pour impression
Personal tools
You are here: Home 2009 Lettre d'information n° 06 SMALL à la recherche d'une meilleure compression
Document Actions

SMALL à la recherche d'une meilleure compression

Cinq instituts collaborent à un nouveau cadre pour le traitement du signal basé sur des représentations parcimonieuses. Financé par l'UE, ce projet pourrait avoir un impact sur les logiciels et les équipements, dans des domaines aussi divers que le multimédia, l'astronomie ou l'imagerie médicale. Explications, avec Rémi Gribonval, directeur de recherche au centre Inria Rennes - Bretagne Atalntique et coordinateur de ce travail.

Cinq instituts collaborent à un nouveau cadre pour le traitement du signal basé sur des représentations parcimonieuses. Financé par l'UE, ce projet pourrait avoir un impact sur les logiciels et les équipements, dans des domaines aussi divers que le multimédia, l'audio, l'astronomie ou l'imagerie médicale. Explications, avec Rémi Gribonval, directeur de recherche  au centre Inria Rennes - Bretagne Atlantique et coordinateur de ce travail.

Piloté par l'équipe de recherche Métiss (1), Small (2) associe l'Ecole Polytechnique Fédérale de Lausanne, l'Université Queen Mary de Londres, l'Université d'Edimbourg, et Technion, l'institut israélien de technologie. Le projet a été sélectionné pour un financement européen sur trois ans dans le cadre du FET Open, une branche du septième programme cadre (FP7) qui encourage l'exploration d'idées radicalement novatrices exigeant de la recherche fondamentale sur le long terme.

"L'Union européenne nous finance à hauteur de 1,9 million d'euros. Le reste est supporté par les cinq instituts." Budget global : 2,5 millions. "Au total, une vingtaine de personnes travailleront sur le projet. Notre branche d'activité, c'est le traitement du signal au sens large. Nos partenaires suisses et israéliens s'intéressent surtout aux aspects vidéo et image. Nos collègues britanniques, eux, sont plus spécialisés sur l'audio et le bio-médical. Notre but, c'est de développer des modèles de représentations de signaux utilisant très peu de paramètres." Les mathématiciens appellent cela une représentation parcimonieuse (3). Cette thématique est "reliée à la compression dans un contexte où il y a un grand nombre de données, ou des données de très grande taille comme, par exemple, une image avec beaucoup de pixels. Nous travaillons sur la restitution du signal quand il y a énormément de bruit dans les données." Typiquement : "la séparation de différentes sources sonores qui sont superposées. On tente d'améliorer la qualité en éliminant les parasites, en renforçant le signal utile et en le représentant dans une dimension sensiblement réduite." Les chercheurs étudient aussi la phase d'acquisition de ce signal. L'objectif est alors de récupérer directement les données sous une forme à la fois minimale et signifiante. On appelle cela l'échantillonnage compressé (4).

Ces travaux ne concernent pas que des phénomènes physiques comme les sons ou les intensités lumineuses. Ils s'appliquent aussi aux informations abstraites, tous les  renseignements  stockés dans les bases de données. "Prenons une entreprise comme Nokia qui voudrait une application pour du co-voiturage. Ici, le signal représente les utilisateurs avec une valeur attribuée pour leur position GPS et une autre pour un profil d'affinité. Passager fumeur ou non fumeur par exemple." Mais, "confrontés à une base de données gigantesque, certains calculs deviennent impossibles, à moins de réduire la représentation de ces données. La gestion de cette énorme masse implique de nouveaux algorithmes de traitement."

Problème : "quand on doit traiter des données récentes ou d'un nouveau type, on ne bénéficie pas de deux siècles de mathématiques pour expliquer comment elles sont structurées." Il faut donc "un moyen d'inférer automatiquement la structure à partir de données d'apprentissage. Imaginons que nous soyons face à un texte dans une nouvelle langue où tous les mots sont collés. Pas d'espace, de ponctuation ... Il va falloir observer, comparer pour discerner progressivement des groupes de lettres, repérer des mots récurrents et trouver ainsi la structure dans le flux d'information. On cherche à composer le dictionnaire à partir d'exemples qui nous aident à reconstruire la connaissance et à appréhender la structure." La base de connaissance permet d'extrapoler les données “en basse résolution” et d'en restaurer une version de meilleure qualité.

Ces travaux devraient d'abord se concrétiser par "des implémentations dans le domaine du logiciel libre et plutôt à des fins de recherche. Nous voulons poser un cadre théorique dans le domaine des algorithmes, mais,  à terme, nous envisageons de coupler l'aspect logiciel et la conception matérielle. On peut s'attendre à un impact sur les appareils d'acquisition, comme les machines d'imagerie par résonance magnétique dans le secteur médical. Il n'est pas invraisemblable de commencer à voir des résultats tangibles dans cinq ans, et peut-être plus tôt encore dans le domaine des effets visuels et sonores. Des plugins dans Photoshop par exemple."

Contact : Rémi Gribonval - 02 99 84 25 06 - remi.gribonval@inria.fr

----
Notes :
(1) Metiss est une équipe commune à l'Inria et au CNRS.
(2) SMALL est l'acronyme de Sparse Models, Algorithms and Learning for Large-scale data.
(3) En anglais : sparse representation.
(4) En anglais : compressed sensing.