Skip to content. | Skip to navigation

Emergences

Lettre d'information n° 18

Image emergences pour impression
Personal tools
You are here: Home 2011 Lettre d'information n° 18 Rémi Gribonval sélectionné par l'ERC
Document Actions

Rémi Gribonval sélectionné par l'ERC

Projection. Apprentissage. Parcimonie. Trois mots clés dans le projet qui vient de valoir au chercheur Inria une subvention du Conseil européen de la recherche (ERC). Ses travaux pourraient avoir des implications dans des domaines allant de l'audiovisuel à l'informatique médicale. Interview.

Projection. Apprentissage. Parcimonie. Trois mots clés dans le projet qui vient de valoir au chercheur Inria une subvention du Conseil européen de la recherche (ERC). Ses travaux pourraient avoir des implications dans des domaines allant de l'audiovisuel à l'informatique médicale. Interview.

Votre projet est très exploratoire.

Oui.  Please (1) se situe sur des thèmes à la frontière entre l'apprentissage statistique (pour la reconnaissance, la classification...) et, en plus bas niveau, le traitement du signal. Nous souhaitons développer des méthodes communes déployables sur tous ces niveaux et pouvant s'instancier différemment selon le niveau où l'on se trouve. En cas de succès, nous espérons parvenir à faire de l'apprentissage sur des tailles de données que nous ne savons pas gérer pour l'instant.

Parcimonie est un peu votre mot fétiche.

Oui. Cela dit, la modélisation parcimonieuse se relie à la notion abstraite de projection. Capter les signaux du monde réel, c'est une façon de les projeter. On ne retrouve pas la réalité, mais une représentation de celle-ci, un peu à la façon de la caverne de Platon. Le son dépend par exemple de l'endroit où l'on pose le micro. Fondamentalement, c'est une forme de projection qui fait perdre de l'information. Si deux éléments sont alignés... on n'en voit qu'un. Un des enjeux pour nous consiste donc à remonter de la projection à l'information d'origine. Cela passe par la construction de modèles.

Modèles au sens d'un a priori sur la nature des données...

Oui. Au lycée, nous avons tous vu qu'en présence de deux équations et trois inconnues, il n'y a pas assez d'information pour reconstruire ces inconnues. Mais si nous disposons de connaissances auxiliaires, cela peut amener, d'une façon indirecte, des éléments pour la reconstruction. Si nous n'avons que deux micros pour enregistrer trois sources dans une pièce, nous ne pouvons pas reconstituer ces sources. Il y a une ambiguïté fondamentale. En revanche, si nous savons que ces sources sont des paroles ou des musiques par exemple, nous sommes en mesure d'exploiter certaines de leurs caractéristiques avec une bonne précision. Ces propriétés nous aident à reconstruire. Là, en l'espèce, ce sont des sources très particulières et beaucoup observées. Des experts se sont penchés sur la bonne façon de les représenter, de caractériser leurs propriétés. Nous savons exploiter cette connaissance pour rendre le problème bien posé.

Mais quid des autres cas de figure ?

C'est justement la phase vitale. Si personne n'a élaboré cette base de connaissance, le problème devient : pouvons-nous effectuer des traitements algorithmiques statistiques sur les données d'origine pour trouver automatiquement d'éventuelles propriétés qui permettront de faire des reconstructions ? On rejoint ici la notion d'apprentissage.

Il y a également un volet classification.

Oui. Nous cherchons à produire une fonction qui prenne une donnée en entrée et attribue un label en sortie. Cette fonction, nous voulons l'apprendre à partir des exemples d'entrées/sorties. Il faut pouvoir la décrire avec peu de paramètres. Sinon, nous n'aurons jamais assez d'exemples d'apprentissage pour estimer tous les paramètres. Il faut donc bien choisir ces paramètres. Par ailleurs, je propose d'explorer des techniques pour transmettre ces fonctions, qui sont des objets de grande dimensionnalité, vers une petite dimension de façon à pouvoir faire des calculs et des apprentissages plus rapides. Il s'agit certainement d'une des parties les plus risquées.

Vous êtes un spécialiste du signal sonore, mais votre projet  va au-delà de ce domaine.

Effectivement. Il peut y avoir d'autres applications. Exemple : les signaux bio-médicaux... Nous cherchons des méthodes permettant de découvrir des dépendances entre ces données, des récurrences, des formes qui se répètent au fil du temps. Mais l'informatique médicale n'est pas notre domaine de spécialité. Nous avons donc entamé des discussions avec plusieurs équipes : l'équipe-projet commune du centre Visages sur l'aspect imagerie du cerveau, le laboratoire de Rennes 1 LTSI sur les encéphalogrammes, ainsi que l'équipe-projet commune du centre Texmex sur les aspects recherche et indexation d'images. Avec ces derniers, nous rejoignons sur les problèmes d'apprentissage, de classification, de reconnaissance du plus proche voisin, de représentation concise d'un objet qui permette de le caractériser, de le comparer à une multitude d'autres. Nous nous intéressons par exemple aux travaux de Hervé Jégou chercheur Inria sur la comparaison d'images dans le domaine compressé.

Une des originalités du projet concerne la caractérisation des dépendances.

C'est une nouveauté par rapport à la façon dont elle est majoritairement abordée. Aujourd'hui, on caractérise ces structures comme des superpositions de récurrences. Un peu comme les Legos. On obtient un objet construit avec peu de briques. C'est associé à la notion de dictionnaire.  Ce que je veux développer ressemblerait plus à de la sculpture : essayer de découvrir les propriétés de ces objets. Et cela via la notion d'opérateurs d'analyse.

Des approches à l'analyse n'existent-elles pas déjà ?

Quelques-unes, certes. Mais très heuristiques. Des algorithmes ont été développés. Des expériences montrent que sur certaines données, ils donnent de meilleurs rapports signal à bruit. Pourtant, nous ne possédons pas les bases théoriques permettant de comprendre pourquoi ils fonctionnent. Dans un premier temps, je souhaite donc une compréhension plus poussée : pourquoi et dans quelles conditions ces approches sont couronnées de succès.

-------
Notes :

(1) PLEASE: Projection Learning and Sparcity for Efficient Data Processing.
(2) Rémi Gribonval est lauréat 2011 du prix Blaise Pascal du Gamni-Smai, décerné par l’Académie des sciences, pour ses travaux en parcimonie. Il travaille au sein de l'équipe - projet Metiss, au sein du centre Inria Rennes - Bretagne Atlantique, équipe - projet commune Inria et CNRS.