Skip to content. | Skip to navigation

Emergences

Lettre d'information n° 30

Image emergences pour impression
Personal tools
You are here: Home 2014 Lettre d'information n° 30 Vers une recommandation personnalisée des contenus web
Document Actions

Vers une recommandation personnalisée des contenus web

Chercheuse au centre Inria de Rennes, Anne-Marie Kermarrec travaille sur un projet de création d'entreprise dans le prolongement d'un projet scientifique soutenu par le Conseil européen de la recherche (ERC). L'objectif est d'aider les éditeurs web à proposer des contenus répondant mieux aux attentes de chaque utilisateur.

Chercheuse au centre Inria de Rennes, Anne-Marie Kermarrec travaille sur un projet de création d'entreprise dans le prolongement d'un projet scientifique soutenu par le Conseil européen de la recherche (ERC). L'objectif est d'aider les éditeurs web à proposer des contenus répondant mieux aux attentes de chaque utilisateur.

L'histoire commence en 2007. Une éternité à l'échelle d'internet. Twitter en est à ses balbutiements. Facebook à ses premiers pas. Directrice de recherche au centre Inria de Rennes, Anne-Marie Kermarrec dépose auprès de l'ERC une demande de financement pour un projet qui prend le nom de Gossple. Son idée : utiliser les techniques décentralisées de pair-à-pair (P2P) pour faire apparaître les affinités et ressemblances qui existent entre les internautes. Construire ensuite des jeux de profils afin de proposer à ces utilisateurs des informations correspondant mieux à leurs préférences. Le tout en considérant que l'on peut apprendre beaucoup grâce à des personnes que l'on ne connaît pas mais avec qui on partage des points communs.

Dossier accepté. Constitution d'une équipe. S'en suivront cinq années de recherche pendant lesquelles le paysage web s'est métamorphosé, conférant à la thématique une pertinence singulière. “Les réseaux sociaux ont pris une importance considérable. Les gens y déposent de plus en plus de productions.”  Photos de vacances sur Flickr, conseils de voyage sur Tripadvisor, recettes de cuisine sur Marmiton, CV sur Linkedin et retrouvailles sur Copains d'avant. Ce foisonnement numérique devient peu à peu le reflet de nos vies et de nos personnalités.

Historique de navigation


Parallèlement un autre phénomène est à l'œuvre : la notification. Plus besoin d'aller chercher l'information via un moteur. Elle nous arrive désormais directement grâce à des systèmes de recommandations qui sont autant de propositions de liens pour poursuivre la navigation.

Mais encore faut-il que ces suggestions répondent vraiment aux attentes des uns et des autres. Et là les choses se compliquent. “Pour personnaliser le contenu, beaucoup de sites s'appuient sur l'historique de navigation.” C'est l'un des vieux ressorts du commerce en ligne. L'acheteur d'une imprimante se voit régulièrement proposer de nouvelles cartouches d'encre. “Mais, cet historique ne constitue pas le seul élément pertinent.

Autre forme de personnalisation : l'abonnement aux flux thématiques. Son défaut : la piètre qualité du filtrage. “Si je m'abonne à un feed RSS sur un thème comme le sport, parmi toutes les informations que je vais recevoir, il y en aura en fait bon nombre qui ne m'intéressent pas...  ou ne m'intéressent plus. Car les centres d'intérêt fluctuent également au fil du temps.”  D'où l'intérêt d'un filtre plus fin et plus instantané.

Filtrage collaboratif


Notre démarche vise donc plutôt à rapprocher les utilisateurs. Nous associons une personne à son réseau social implicite, c'est-à-dire aux gens qui lui ressemblent (qu'elle ne connait pas nécessairement). À partir de là, nous construisons un moteur de recommandations dynamiques. À l'origine, notre projet reposait sur des techniques décentralisées de pair-à-pair. Le fait d'avoir ainsi travaillé sur des algorithmes P2P nous permet aujourd'hui de reconstruire un système efficace avec simplement des données partielles.” Le logiciel s'affranchit des problèmes d'échelle. Il prend soin aussi de préserver l'anonymat en dissociant informations nominatives et préférences exprimées.

À l'issue de ces recherches, il m'a semblé que nos travaux pouvaient permettre d'aller plus loin. En prolongement de la bourse ERC, durant l'année 2013, nous avons bénéficié du dispositif Proof of Concept de l'ERC. Ce financement complémentaire permet aux scientifiques de continuer à travailler sur leurs prototypes afin de les rendre transférables vers le monde économique. Nous nous orientons maintenant vers la création d'une start-up.

Plug-in de recommandation personnalisée


Pour les éditeurs, la solution proposée prendra la forme d'un plug-in intégré dans la page web. Le visiteur, lui, verra une sélection de liens personnalisés en fonction d'un profil établi dynamiquement. “Des panels d'utilisateurs testent actuellement le système au sein du pôle d'excellence Trento Rise, en Italie (1).

Le démarrage de l'entreprise devrait intervenir courant 2014. Qui en seront les clients ? “Trop tôt pour le dire. Mais ces techniques intéressent par exemple les sites d'information qui peuvent ainsi escompter une augmentation de trafic, une durée de lecture plus importante...”  Les formes de monétisations, elles aussi, restent à définir. “Commission au clic ou abonnement par exemple. Pour notre business plan, nous recevons actuellement les conseils d'un consultant dans le cadre du  projet ERC Proof of Concept. Ce projet est aussi soutenu par un financement EIT-ICT Labs. Enfin, nous bénéficions aussi du support d'Inria où nous rencontrons énormément d'énergie positive, que ce soit du côté du service transfert, de celui des brevets, ou encore d'IT Translation (2). En tant que scientifiques à l'institut, nous sommes très bien entourés et c'est très motivant.


--------
Notes :

(1) Cette collaboration intervient dans le cadre du programme européen EIT ICT Labs, dont Inria est partenaire.
(2) Le fonds d’investissement IT-Translation Investissement, créé en 2011 par CDC Entreprises (BPI France) et Inria et rejoint en 2013 par le Fonds Européen d’Investissement intervient pour «l’ultra-amorçage» des entreprises du numérique à forte composante technologique.