Skip to content. | Skip to navigation

Emergences

Lettre d'information n° 25

Image emergences pour impression
Personal tools
You are here: Home 2013 Lettre d'information n° 25 Les flâneries de l'œil à la loupe
Document Actions

Les flâneries de l'œil à la loupe

De nombreuses lois régissent l'attention visuelle. Cependant, il est possible, dans une certaine mesure, de prédire le parcours du regard. Comme l'explique le chercheur Olivier Le Meur, cette technique trouve des applications dans des domaines allant de la compression vidéo sélective à l'optimisation publicitaire.

De nombreuses lois régissent l'attention visuelle. Cependant, il est possible, dans une certaine mesure, de prédire le parcours du regard. Comme l'explique le chercheur Olivier Le Meur, cette technique trouve des applications dans des domaines allant de la compression vidéo sélective à l'optimisation publicitaire.

Quand il enseigne à l'Esir (1) de Rennes, Olivier Le Meur se plaît à montrer la vidéo ci-dessous à ses étudiants. Dans cette pétillante parodie de film policier à la Hercule Poirot, pratiquement tout le décorum change en moins d'une minute sans que quiconque ne s'en aperçoive.  Difficile d'imaginer meilleure illustration de ce qu'est l'attention visuelle... et de ce qu'elle n'est pas.

"Effectivement, l'œil humain s'avère parfois très sélectif, constate Olivier Le Meur. Sirocco(2), notre équipe de recherche, étudie comment prédire le parcours oculaire. Détecter automatiquement où se porte le regard peut présenter de l'intérêt.” Exemple ? “Pour économiser de la bande passante durant une transmission vidéo, on peut appliquer un taux de compression moins élevé à une partie de l'image qui attire l'attention et, inversement, compresser d'avantage les zones non regardées.” Autrement dit : garder la meilleure qualité pour les footballeurs dribblant leurs adversaires mais dégrader les recoins de pelouse où il ne se passe rien. Le secteur de la publicité utilise de plus en plus des modèles de prédiction non seulement pour estimer l'impact des spots mais aussi pour évaluer le meilleur positionnement des encarts. Cette technique coûte moins cher que de recourir à des tests utilisateurs (expérimentation de suivi de regards).

Proies et prédateurs

L'attention visuelle est un mécanisme biologique qui permet à tout un chacun de sélectionner des informations pertinentes dans son champ visuel. Ce mécanisme est piloté par deux aspects. Dans les toutes premières secondes, intervient ce que l'on appelle l'attention bottom-up. Cela relève du réflexe. Au début de la visualisation, la plupart des gens regardent aux mêmes endroits. L'oeil est attiré par des éléments contrastant avec les autres. Un point noir sur des points blancs par exemple. Cette singularité porte le plus d'information et s'avère fondamentale pour comprendre l'image. Ce peut être une couleur différente, un mouvement ou tout autre élément qui permet de rapidement détecter quelque chose d'incongru dans l'environnement. Ce balayage rapide est de nature ancestrale.”  Un lointain héritage où notre ancêtre devait guetter proies et prédateurs.

D'autres facteurs de plus haut niveau prennent ensuite le relais. “Ces mécanismes top-down font appel à la partie cognitive du cerveau ainsi qu'à notre a priori sur le monde. Exemple : ‘Je distingue une rue dans la photo. Je connais ce quartier. J'y ai déjà visité un magasin. Tiens, je vais essayer de le repérer.’ L'observateur se fixe une tâche. À partir de cet instant, c'est fini. On ne peut plus modéliser. Cela devient trop spécifique.” Pour cette raison, les chercheurs se bornent aux premiers coups d'œil. “Habituellement, nous travaillons sur les 8 premières secondes. Durant cette période, ce sont les informations contenues dans la scène qui ‘imposent’ le parcours visuel. Cette étape est très rapide. Elle s'effectue inconsciemment.

Des modèles plus performants

Cela dit, même durant cette fenêtre d'opportunité, la prédiction du regard reste parsemée d'embûches. “Quand on leur présente des scènes de plein air, les observateurs ont tendance à regarder l'horizon. Si on opère une rotation de l'image, les fixations se retrouvent... sur la même ligne ! Inconsciemment, l'oeil sait qu'à cet endroit, il peut espérer voir quelque chose d'intéressant. Dans le même ordre d'idée, le visage humain constitue un autre attracteur visuel bottom-up. Pour réaliser des modèles de prédiction plus performants, il faut prendre en compte ces biais et bien d'autres.”

Reste ensuite à évaluer ces modèles. Ce qui en soit “constitue déjà un challenge. Il faut comparer les prédictions à une vérité terrain.”  Celle-ci s'acquiert par des panels durant lesquels des tests oculométriques mesurent les déplacements du regard. Mais “ces expériences exigent des protocoles très bien définis” pour faire le tri entre ce qui relève du réflexe (bottom-up) et ce qui appartient au cognitif (top-down).

Quid de la 3D ?

S'attelant à un nouveau défi, Olivier Le Meur lorgne désormais vers la 3D. “Nous nous intéressons aux changements de comportements induits par la stéréoscopie. Face à ces images, les observateurs s'attardent d'avantage sur le premier plan.”  Mais dans quelle mesure l'information 3D modifie-t-elle l'attention, cela reste à voir...

--------
Notes :
(1) L'Esir (École Supérieure d’Ingénieurs de Rennes) est une école interne de l' université de Rennes 1.
(2) Ancien chercheur chez Technicolor SA, Olivier Le Meur est membre de Sirocco, une équipe de recherche commune Inria, Université Rennes 1, CNRS.