Skip to content. | Skip to navigation

Emergences

Lettre d'information n° 03

Image emergences pour impression
Personal tools
You are here: Home 2009 Lettre d'information n° 03 GenOuest au service des biotechnologies
Document Actions

GenOuest au service des biotechnologies

Gérée par l'Inria, à Rennes, GenOuest est une plate-forme bio-informatique offrant à la communauté des biologistes du stockage, du calcul, des logiciels et de l'assistance.

Gérée par l'Inria, à Rennes, GenOuest est une plate-forme bio-informatique offrant à la communauté des biologistes du stockage, du calcul, des logiciels et de l'assistance.

Au fond d'un long couloir, dans les entrailles de l'Inria, un cluster fait bourdonner les 200 processeurs de ses 50 noeuds. Physiquement, GenOuest se présente d'abord sous la forme d'une grappe d'ordinateurs offrant de la puissance de calcul et 20 téraoctets d'espace de stockage pour les données biologiques.

"La biologie est une discipline qui a sans cesse besoin de se confronter à des résultats antérieurs", explique Olivier Collin, responsable de l'installation. "Les résultats de séquençage produisent désormais des millions de séquences qu'il faudra comparer pour détecter similarités et homologies. D'où la nécessité de disposer d'un environnement adapté proposant puissance et banques de données". Ces banques sont hétérogènes et volumineuses. Leur utilisation locale nécessite beaucoup de reformatage et implique de longs temps de calcul. Mais "pour les biologistes, ces données constituent le nerf de la guerre. Une partie de notre travail consiste donc à stocker ces banques publiques et à les mettre à la disposition de la communauté scientifique". Cette tâche est réalisée grâce à un outil développé par la plate-forme en partenariat avec deux autres plates-formes bio-informatiques françaises, BioMAJ (Biologie Mise A Jour) qui est un outil de gestion automatisé des banques de séquences (1). Déjà, "plusieurs autres plates-formes en France utilisent ce logiciel" qui permet le post-traitement et l'indexation des bases. Auparavant, "ce travail pouvait s'avérer très chronophage et ce nouvel outil offre un gain de productivité intéressant. Pour nos ingénieurs, c'est un allégement de la charge de travail."

Au carrefour de la biologie et de l'informatique depuis 2001, GenOuest est une plate-forme à la fois de recherche et de services dans le cadre de Ouest-Génopole, un réseau regroupant les acteurs des biothechnologies dans les régions Bretagne et Pays de la Loire. Le concept de génopole est né d'une volonté de renforcer la recherche génomique française en créant des pôles régionaux autour du triptyque : laboratoires de recherche, entreprises de biotechnologies et enseignement supérieur. "C'est à la fois un enjeu stratégique et une mesure d'aménagement du territoire."

Ce réseau rassemble quelque 800 chercheurs travaillant dans plus de 50 laboratoires (2) essentiellement sur quatre domaines : mer, agro, santé et bio-informatique. La plate-forme est ouverte à toute collaboration avec le monde industriel. Dans le tissu bio-informatique français, GenOuest cohabite avec plusieurs autres plates-formes. "Chacune possède sa propre coloration. Pour GenOuest, c'est la recherche de motifs. Une fois un gène séquencé, en déduire la fonction demeure parfois difficile. L'utilisation des motifs permet d'identifier des éléments jouant un rôle précis et souvent associés à une fonction. Il faut comparer les séquences pour identifier ces balises fonctionnelles. A partir de cette analyse in silico, le biologiste pourra apporter des réponses à ses questions." Mais il pourra également émettre des "hypothèses appelant ensuite à être vérifiées in vivo."

Pour autant, GenOuest n'est pas simplement un fournisseur de puissance de calcul et un hébergeur de bases de données. "Nous occupons une position stratégique grâce à l'équipe Symbiose", une équipe de recherche INRIA spécialisée en bio-informatique. "C'est ce voisinage qui constitue l'identité de la plate-forme. Symbiose réalise la recherche, développe et met au point des prototypes de logiciels. GenOuest les intègre et les met en production, à disposition des utilisateurs. Nous avons un rôle d'intermédiation entre les biologistes et l'informatique, l'équipe Symbiose s'attachant à résoudre des problèmes qui ne sont pas de l'ordre de l'ingénierie, mais de la recherche."

Parmi les outils développés, figure, par exemple, Protomata, un logiciel qui permet de traiter des séquences protéiques en automatisant la modélisation de familles de protéines. Protomata a été élaboré dans le cadre de travaux de recherche de l'équipe Symbiose, notamment une thèse. Cet outil a été mis à disposition de la communauté par la plate-forme GenOuest.  Il fait partie d'un ensemble d'outils innovants  où l'on trouve également Stan, Wapam, GenoFrag, iThos, Pygram. Cela dit, "nous accueillons aussi les outils développés par des tiers : les logiciels des laboratoires du CNRS, de l'INRA, de l'Inserm ou de l'Université de Rennes ; des  outils qui bénéficient de l'infrastructure et de la puissance de calcul de l'INRIA."

GenOuest est par ailleurs certifiée ISO9001:2000 depuis mai 2008. Cette norme définit un fonctionnement reposant sur une approche qualité formalisée en particulier à travers des référentiels. "Pour nous, c'est aussi un outil de management, avec en tête, le souci d'organiser la pérennité du service" à un moment où la production de données ne fait qu'augmenter. Ce qui signifie qu'il faudra aussi continuer d'accroître les capacités de traitement. Après le calcul parallèle en grappes, les plates-formes vont s'orienter vers les grilles : des ordinateurs répartis à différents endroits permettant de distribuer le calcul. Cette organisation du secteur passera aussi par la création d'une infrastructure bio-informatique paneuropéenne dont les contours s'esquissent dans un avant projet européen baptisé Elixir.



Notes :
(1) BioMAJ est né de la collaboration en 2005 de l'INRIA de Rennes, l'INRA de Toulouse et de Jouy-en-Josas.
(2)  Laboratoires des universités de l'Ouest, des CHU, de l'Institut de Télécom Bretagne, du CNRS, de l'Inserm, de l'INRA, de l'IFREMER et de l'INRIA.