Skip to content. | Skip to navigation

Emergences

Lettre d'information n° 02

Image emergences pour impression
Personal tools
You are here: Home 2009 Lettre d'information n° 02 Pourquoi Quaero n'est pas Google
Document Actions

Pourquoi Quaero n'est pas Google

Présenté au début comme un moteur de recherche européen, le projet Quaero recouvre une réalité toute autre, comme l'explique l'un de ses acteurs, Patrick Gros, directeur de recherche à l'Inria.

Présenté au début comme un moteur de recherche européen, le projet Quaero recouvre une réalité toute autre, comme l'explique l'un de ses acteurs, Patrick Gros, directeur de recherche à l'Inria.

"Si Quaero a pu créer certaines interrogations avant son lancement, c'est en partie lié à la façon dont le programme a émergé." Voulu au  plus haut niveau et annoncé à l'occasion d'un sommet franco-allemand en 2005, "Quaero a été présenté comme le futur Google européen. Or, il  ne s'agit pas vraiment de cela : nous ne sommes pas en train de  fabriquer un moteur de recherche grand public européen".

Comme cela se pratique dans tous les consortia européens, le  partenariat s'est constitué en fonction des compétences, des  complémentarités, des intérêts stratégiques des partenaires, et aussi  des expériences de collaboration précédentes. "Mais,  complète Pieter van der Linden, coordinateur du projet chez Thomson, on ne peut pas être 150 dans un tel consortium. Certaines entreprises qui  ne sont pas dans Quaero participent à d'autres groupements.  Inversement, une société comme la nôtre est aussi absente d'autres  consortia. Dans les deux cas, les absents peuvent légitimement  revendiquer des compétences. Le consortium a suivi un processus de gestation somme tout similaire à ce qui se fait dans les projets  européens ou nationaux". 

Le montage  de Quaero a pris trois ans.  Mais le programme est lancé. Il a effectivement démarré   en mai 2008, avec 25 partenaires, une subvention française de 99 M€ et une feuille de route pour 5 ans. Au total, six équipes Inria sont impliquées.

Quaero n'est pas Google. "C'est un consortium qui juxtapose en réalité 5 projets applicatifs. Chacun porté par un industriel leader, pour qui c'est un sujet crucial."  Tout d'abord : le DMAM (1). "Un outil de gestion des grandes archives audio-visuelles. Prenez par exemple le Grand Echiquier de Jacques Chancel. L'Ina en conserve 300 émissions. 900 heures. Mais il n'existe pas d'outil pour automatiser la gestion de ces vidéos. Identifier automatiquement les plages de musique. Retrouver instantanément les interviews d'invités récurrents... Tout se fait à la main." Idem pour le dernier match de foot. "Une chaîne qui diffuse la rencontre ne peut pas la recycler facilement pour une utilisation immédiate sur le web, ce qu'on appelle la ré-éditorialisation. Il faudrait pouvoir offrir à l'internaute les différents angles de caméras, les sélections de moments clés... Aujourd'hui, tout ceci reste un travail de montage manuel. Aucun gain de temps quand on adapte un contenu au nouveau support. Les entreprises ont besoin d'outils pour résoudre ce problème." Sur ce projet, le leader est Thomson.  L'industriel pilote aussi le projet PVAA (2) qui va permettre aux diffuseurs  de proposer des programmes et de la publicité en fonction de profils dynamiques d'utilisateurs. Vient ensuite le TIAE (3) pour optimiser la conversion de documents. "Typiquement la numérisation de bibliothèques et la navigation dans ces données." Industriel de référence : Jouve, imprimeur spécialiste de la dématérialisation documentaire. Dirigé par France Telecom, le projet MSSE (4), lui, regroupe des technologies pour portails multimédias. Par exemple pour améliorer le filtrage des images en fonction des publics.  Arrive enfin le CMSS (5), moteur de recherche multimédia combinant transcription de bande son, détection d'événements vidéo, analyse de similarité dans des images... Un projet piloté par Exalead, spécialiste français des moteurs de recherche pour entreprises.

"Il est intéressant de noter que certaines des entreprises associées à Quaero sont concurrentes entre-elles. Donc il a  fallu apprendre à gérer ces concurrences. Chacun des projets possède sa vie propre. Entre certains d'entre-eux, il y a volontairement des cloisonnements." Usine à gaz alors ? "Le montage est compliqué, certes, mais il existe des factorisations intéressantes. Au dessus de ces projets très applicatifs qui sont très en aval, il y a une première couche transversale. Elle concerne tout le monde et on y trouve surtout des chercheurs académiques. Son rôle est de proposer des technologies de base qui puissent servir aux cinq projets. On a appelé cette couche le Core Technology Cluster. Et comme beaucoup d'entreprises sont impliquées, on tend vers des technologies génériques. On évite d'avoir à en passer par les fourches caudines d'un développement qui serait purement spécifique à chaque entreprise."

A cela s'ajoute une deuxième couche transversale : celle de l'évaluation. "C'est une phase pleinement intégrée dans Quaero. Une partie conséquente du budget y est affectée. Cet investissement finance un long travail pour vérifier si nos algorithmes passent. Mais aussi pour mesurer leurs performances. A partir de là, l'industriel, peut dire “ça m'intéresse“ ou “ça ne m'intéresse pas“. Cette évaluation intègre aussi les usages... Quelque-chose qui, dans beaucoup de recherches, a souvent été un peu zappé. Par ailleurs, Quaero s'étend sur 5 ans. C'est plus long qu'un contrat européen. Ce qui présente beaucoup d'avantages. D'abord on peut mener des thèses dans de meilleures conditions. Ensuite, les relations entre chercheurs et industriels se construisent sur la durée. Un industriel ne va pas mettre spontanément ses données et ses roadmaps sur la table. C'est de la relation de confiance bâtie sur le long terme. Avec l'Ina, avec Thomson, on se connaît bien et depuis longtemps. Nous saisissons bien leur vision. Ils savent ce qu'ils peuvent attendre de nous. Donc, on peut travailler plus loin en aval."

Alors rendez-vous donc en 2012 ? "En fait, il y a déjà des résultats visibles. Certaines entreprises n'ont pas attendu le démarrage officiel pour travailler ensemble. Prenez Exalead et LTU. Elles se sont rencontrées durant le montage. L'une s'est aperçue que l'autre possédait une technologie permettant de détecter automatiquement des visages dans une image. Elle l'a déjà intégrée pour une application dans la gestion de portraits."

Notes :
(1) Digital Media Asset Management
(2) Personalized Video Anytime Anywhere
(3) Text and Image Annotation Engine
(4) Multimedia Search Services for European Portals
(5) Consumer Multimedia Search Services