Comment choisir le répertoire de sortie pour un outil Galaxy?

12 Sep 2012

      Bonjour à tous,

Pour notre instance locale de Galaxy, nous souhaitions que nos
utilisateurs puissent choisir l'emplacement ou écrire leurs résultats et
cela sans "casser" les liens dans la base de donnée.

Pour cela, nous avons ainsi mis en place une modification simple du xml
des outils existants:

Prenons l'exemple d'un outil simple dont le xml serait le suivant:

<tool id="example" name="Tool example">
  <description>Un exemple d'outil simple</description>
  <command interpreter="bash">example.sh -i $input -o $output</command>
  <inputs>
    <param name="input" type="text" label="Input"/>
  </inputs>
  <outputs>
    <data format="txt" name="output" label="outputExample"/>
  </ouputs>
</tool>

Dans cet exemple, le fichier de sortie portera le nom "dataset_xxx" et
sera écrit dans le répertoire par défaut
<INSTALL_GALAXY>/galaxy-dist/database/files/000/

La modification que nous allons apporter maintenant va nous permettre de
définir le répertoire d'écriture de l'output ainsi que le nom du fichier.

Après modification, le xml ressemble à ça:

<tool id="example" name="Tool example">
  <description>Un exemple d'outil simple</description>
  <command interpreter="bash">example.sh -i $input -o $output;mv $output
$output_dir/${file_name}.txt 2>/dev/null;ln -s
$output_dir/${file_name}.txt $output</command>
  <inputs>
    <param name="input" type="text" label="Input"/>

    <!-- Output directory-->

    <param name="file_name" type="text" size="150" label="File name
(without extension)">
       <validator type="empty_field" message="You must specify a file
name"/>
    </param>
    <param name="output_dir" type="text" size="150" label="Output
directory">
       <validator type="empty_field" message="You must specify an output
path"/>
    </param>

    <!---->

  </inputs>
  <outputs>
    <data format="txt" name="output" label="outputExample"/>
  </ouputs>
</tool>

Nous avons 2 champs input pour le path et le nom du fichier de sortie
(ainsi que les valideurs associés, l'outil ne s'execute pas si l'un de
ces champs est vide).
Puis dans la balise <command> , nous avons ajouter:

mv $output $output_dir/${file_name}.txt 2>/dev/null;ln -s
$output_dir/${file_name}.txt $output

qui correpond à un move de
<INSTALL_GALAXY>/galaxy-dist/database/files/000/dataset_xxx vers
<OUTPUT_CHOISIT>/<NOM_DE_FICHIER_CHOISIT>,
suivit de la création d'un lien symbolique
<INSTALL_GALAXY>/galaxy-dist/database/files/000/dataset_xxx qui pointe
vers <OUTPUT_CHOISIT>/<NOM_DE_FICHIER_CHOISIT>.

Cette modification fonctionne très bien quelque soit l'interpreteur
défini dans la balise <command>, et est surtout très rapide à mettre en
place.

Je suis très interressé de savoir si d'autres personnes ont implémentés
une solution pour le choix du répertoire de sortie, et si oui de quelle
manière?

Bonne journée à tous,

Alban

-- 

Alban Lermine 
Unité 900 : Inserm - Mines ParisTech - Institut Curie
« Bioinformatics and Computational Systems Biology of Cancer »
11-13 rue Pierre et Marie Curie (1er étage) - 75005 Paris - France
Tel : +33 (0) 1 56 24 69 84

Alban Lermine

Christophe Antoniewski

Alban Lermine

Christophe Antoniewski

tags

participants (2)