Suite à la présentation du groupe de travail Galaxy Grand Ouest (GUGGO) sur la liste bioinfo, les plateformes BiRD, GenOuest et le PCIM ont souhaité présenter conjointement leurs initiatives de mise en place d'instances de Galaxy, s'ajoutant à celle déjà faite de la plateforme ABiMS de Roscoff:
-L'instance GenOuest:
La plateforme Genouest ( http://www.genouest.org ) propose de nombreux services en bioinformatique. Suite à la demande de création de compte, les scientifiques en sciences de la vie, principalement de Bretagne et Pays de la Loire, ont ainsi accès à un jeu complet d’outils bioinformatiques, de banques de données publiques mises à jours quotidiennement et de nombreux liens vers des séminaires, des formations, et autres contenus d’intérêt. La plateforme, labélisée ISO 9001 propose à la fois un fonctionnement sous forme de libre-service et des collaborations pour des projets nécessitant une forte expertise en bioinformatique et/ou d’importants développements. Depuis début 2012, nous organisons la mise en place d’une instance Galaxy pour la communauté Biogenouest. Dans ce cadre, des ressources ont été spécifiquement mobilisées afin de tester l’utilisation de Galaxy et Mobyle sur un cluster SGE. Parallèlement à cela, un groupe de travail, le Galaxy User Group Grand Ouest (GUGGO), a été créé, et une première réunion officielle effectuée le 5 avril 2012. L’instance de GalaxyatGenouest ( http://galaxy.genouest.org ):
* propose un volet analyse de données, notamment en génomique, protéomique, génétique des populations, génétique quantitative et phylogénie. Pour cela, ont été incorporés des composants Galaxy d’une part et des outils développés par la plateforme GenOuest mais également par la communauté scientifique du Grand Ouest d’autre part. * est dotée d’une gestion de version basée sur Gitlab * est associé à un dispositif de gestion des données et métadonnées développé autour du système ISA-Infrastructure (pour plus d’informations : http://emme.genouest.org/emme/). * est testée dans le cadre d’analyses de données environnementales autour de la collaboration avec l’OSUR (Observatoire des Sciences de l’Univers de Rennes). Les développements s’appliqueront au traitement récurrent des données produites par les plateformes de séquençage notamment via des outils tels que Mothur ou Dnaclust. De plus des petits scripts pour automatiser la formation et l’analyse d’OTUs (Operationnal Taxonomic Units) à partir de fichiers de séquences sont proposés.
Dans le cadre des formations proposées par la plateforme, une demi-journée d’introduction au portail Galaxy est proposée depuis le début de l’année 2013. Nous réfléchissons et testons actuellement la mise en place de formations thématiques. L’utilisation de portails web d’analyse de données comme Galaxy et Mobyle nous parait essentielle à l’amélioration des connexions entre biologistes, bioinformaticiens et ressources informatiques. La mise en place d’un tel système d’analyse et de partage des données au sein de communautés est au centre des réflexions actuelles autour de l‘évolution des pratiques de la recherche en sciences de la vie. Les aspects collaborations deviennent de plus en plus “à la mode”. Il apparaît clairement que la mutualisation d‘équipements et de connaissances a beaucoup a apporter à nos communautés pour négocier au mieux le virage du digital. Nous souhaitions profiter de cette présentation pour revenir sur ces aspects collaboratifs qui nous apportent à tous un gain de temps et d’efficacité. Dans cette optique, nous voulions mentionner le fait que l’instance de Galaxy mise en place sur la plateforme GenOuest a été dupliquée et est utilisée par nos collègues de la plateforme INRA de génomique des insectes ravageurs de cultures BIPAA (BioInformatics Platform for Agro-ecosystems Arthropods, http://www.inra.fr/bipaa/ ). Nous souhaitions également en profiter pour remercier les membres de la plateforme Migale spécialement Sandra Dérozier et Franck Samson. Ils ont en effet proposés de mettre en partage des scripts qu’ils avaient développés pour l’utilisation de Velvet sur leur instance de Galaxy suite à la demande d’un personnel INRA du centre de Rennes. Nous tenions a saluer ce geste collaboratif!
-L’instance galaxyatIfremer :
Le service RIC (Ressources Informatiques et Communications) du centre Ifremer de Brest travaille sur la mise à disposition d’une instance Galaxy interfacée avec la machine de calcul du PCIM (Pôle de Calcul Intensif pour la Mer – http://wwz.ifremer.fr/pcim ) pour proposer à la communauté ifremérienne : * des workflows pour l’analyse qualité des données NGS, pour l’analyse de données RNA-seq et Chip-seq * la réalisation d’analyses de métagénomiques basées sur la suite QIIME 1.7
Cette instance passera en production à la rentrée 2013 et servira de support pour former les équipes Ifremer à l’analyse de leurs données RNA-Seq. En fonction de son (espéré !) succès en interne et sous condition de disposer de ressources humaines suffisantes pour maintenir cette instance, il sera envisager d’ouvrir ce service à une plus large communauté. Le service RIC est très favorable pour partager son retour d’expérience avec celui des autres plateformes en terme d’administration de galaxy ou intégration d’outils, ainsi que pour la création et la contribution à un toolshed commun au sein du groupe GUGGO.
-La plateforme de Bioinformatique de Nantes (BiRD) :
BiRD propose une offre de service historiquement centrée sur la génomique. Elle offre un service d’expertise dans l’analyse de données de puces à ADN, ainsi que dans l’analyse de données issues des nouvelles technologies NGS. La plateforme a installé une première instance de développement de Galaxy sur un serveur interne, et teste la mise en place d’outils pour le contrôle qualité et l’analyse du transcriptome.
Un cluster de calcul mutualisé est en cours de mise en place. A terme, BiRD souhaite mettre à disposition une instance de Galaxy sur ce cluster avec des outils spécifiques de la génomique.
La liste de diffusion Galaxy France est une très bonne opportunité pour tous d‘échanger. Merci pour sa mise en place et son animation!
A bientôt,
Pour le groupe de travail GUGGO,
--------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- Yvan Le Bras, PhD <°))))>< e-Biogenouest project http://www.e-biogenouest.org CNRS UMR 6074 IRISA-INRIA, Campus de Beaulieu, 35042 Rennes Cedex tél.: +33 (0) 2 99 84 72 78 / +33 (0) 6.10.43.96.51 yvan.le_bras@irisa.fr