Pourquoi Quaero n'est pas Google
Présenté au début comme un moteur de recherche européen, le projet Quaero recouvre une réalité toute autre, comme l'explique l'un de ses acteurs, Patrick Gros, directeur de recherche à l'Inria.
Présenté au début comme un moteur de recherche européen, le projet Quaero recouvre une réalité toute autre, comme l'explique l'un de ses acteurs, Patrick Gros, directeur de recherche à l'Inria.
"Si Quaero a pu créer certaines interrogations avant son lancement, c'est en partie lié à la façon dont le programme a émergé." Voulu au plus haut niveau et annoncé à l'occasion d'un sommet franco-allemand en 2005, "Quaero a été présenté comme le futur Google européen. Or, il ne s'agit pas vraiment de cela : nous ne sommes pas en train de fabriquer un moteur de recherche grand public européen".
Comme cela se pratique dans tous les consortia européens, le partenariat s'est constitué en fonction des compétences, des complémentarités, des intérêts stratégiques des partenaires, et aussi des expériences de collaboration précédentes. "Mais, complète Pieter van der Linden, coordinateur du projet chez Thomson, on ne peut pas être 150 dans un tel consortium. Certaines entreprises qui ne sont pas dans Quaero participent à d'autres groupements. Inversement, une société comme la nôtre est aussi absente d'autres consortia. Dans les deux cas, les absents peuvent légitimement revendiquer des compétences. Le consortium a suivi un processus de gestation somme tout similaire à ce qui se fait dans les projets européens ou nationaux".
Le montage de Quaero a pris trois ans. Mais le programme est lancé. Il a effectivement démarré en mai 2008, avec 25 partenaires, une subvention française de 99 M€ et une feuille de route pour 5 ans. Au total, six équipes Inria sont impliquées.
Quaero n'est pas Google. "C'est un consortium qui juxtapose en réalité 5 projets applicatifs. Chacun porté par un industriel leader, pour qui c'est un sujet crucial." Tout d'abord : le DMAM (1). "Un outil de gestion des grandes archives audio-visuelles. Prenez par exemple le Grand Echiquier de Jacques Chancel. L'Ina en conserve 300 émissions. 900 heures. Mais il n'existe pas d'outil pour automatiser la gestion de ces vidéos. Identifier automatiquement les plages de musique. Retrouver instantanément les interviews d'invités récurrents... Tout se fait à la main." Idem pour le dernier match de foot. "Une chaîne qui diffuse la rencontre ne peut pas la recycler facilement pour une utilisation immédiate sur le web, ce qu'on appelle la ré-éditorialisation. Il faudrait pouvoir offrir à l'internaute les différents angles de caméras, les sélections de moments clés... Aujourd'hui, tout ceci reste un travail de montage manuel. Aucun gain de temps quand on adapte un contenu au nouveau support. Les entreprises ont besoin d'outils pour résoudre ce problème." Sur ce projet, le leader est Thomson. L'industriel pilote aussi le projet PVAA (2) qui va permettre aux diffuseurs de proposer des programmes et de la publicité en fonction de profils dynamiques d'utilisateurs. Vient ensuite le TIAE (3) pour optimiser la conversion de documents. "Typiquement la numérisation de bibliothèques et la navigation dans ces données." Industriel de référence : Jouve, imprimeur spécialiste de la dématérialisation documentaire. Dirigé par France Telecom, le projet MSSE (4), lui, regroupe des technologies pour portails multimédias. Par exemple pour améliorer le filtrage des images en fonction des publics. Arrive enfin le CMSS (5), moteur de recherche multimédia combinant transcription de bande son, détection d'événements vidéo, analyse de similarité dans des images... Un projet piloté par Exalead, spécialiste français des moteurs de recherche pour entreprises.
"Il est intéressant de noter que certaines des entreprises associées à Quaero sont concurrentes entre-elles. Donc il a fallu apprendre à gérer ces concurrences. Chacun des projets possède sa vie propre. Entre certains d'entre-eux, il y a volontairement des cloisonnements." Usine à gaz alors ? "Le montage est compliqué, certes, mais il existe des factorisations intéressantes. Au dessus de ces projets très applicatifs qui sont très en aval, il y a une première couche transversale. Elle concerne tout le monde et on y trouve surtout des chercheurs académiques. Son rôle est de proposer des technologies de base qui puissent servir aux cinq projets. On a appelé cette couche le Core Technology Cluster. Et comme beaucoup d'entreprises sont impliquées, on tend vers des technologies génériques. On évite d'avoir à en passer par les fourches caudines d'un développement qui serait purement spécifique à chaque entreprise."
A cela s'ajoute une deuxième couche transversale : celle de l'évaluation. "C'est une phase pleinement intégrée dans Quaero. Une partie conséquente du budget y est affectée. Cet investissement finance un long travail pour vérifier si nos algorithmes passent. Mais aussi pour mesurer leurs performances. A partir de là, l'industriel, peut dire “ça m'intéresse“ ou “ça ne m'intéresse pas“. Cette évaluation intègre aussi les usages... Quelque-chose qui, dans beaucoup de recherches, a souvent été un peu zappé. Par ailleurs, Quaero s'étend sur 5 ans. C'est plus long qu'un contrat européen. Ce qui présente beaucoup d'avantages. D'abord on peut mener des thèses dans de meilleures conditions. Ensuite, les relations entre chercheurs et industriels se construisent sur la durée. Un industriel ne va pas mettre spontanément ses données et ses roadmaps sur la table. C'est de la relation de confiance bâtie sur le long terme. Avec l'Ina, avec Thomson, on se connaît bien et depuis longtemps. Nous saisissons bien leur vision. Ils savent ce qu'ils peuvent attendre de nous. Donc, on peut travailler plus loin en aval."
Alors rendez-vous donc en 2012 ? "En fait, il y a déjà des résultats visibles. Certaines entreprises n'ont pas attendu le démarrage officiel pour travailler ensemble. Prenez Exalead et LTU. Elles se sont rencontrées durant le montage. L'une s'est aperçue que l'autre possédait une technologie permettant de détecter automatiquement des visages dans une image. Elle l'a déjà intégrée pour une application dans la gestion de portraits."
Notes :
(1) Digital Media Asset Management
(2) Personalized Video Anytime Anywhere
(3) Text and Image Annotation Engine
(4) Multimedia Search Services for European Portals
(5) Consumer Multimedia Search Services