- Klaus von Grafenstein (process downloadFastQ, downloadChr, downloadGtf, écriture README)
- Virginie Noël (process indexGenome, mapFastQ, indexBamFiles, countReads)
- Arnaud Maupas (process statAnalysis et script R)
Le but est reproduire les études de Harbour, Roberson et al. 2013 et Furney, Pedersen et al 2013 portant sur des données RNA-Seq d'individus avec un cancer oculaire, en regardant si les individus ayant la mutation SF3B1 ont des gènes différemment exprimés de ceux ayant également ce cancer, mais pas la mutation, cela à l'aide d'un workflow reproductible.
- Nextflow Version 21.10.0.5640
- Docker Version 20.10.11
- Git Version 2.25.1
- SRA Toolkit Conteneur pegi3s/sratoolkit : version 2.10.0
- STAR Conteneur evolbioinfo/star:v2.7.6a : version 2.7.6a
- SAMtools Conteneur evolbioinfo/samtools:v1.11 : version 1.11
- Subread Conteneur evolbioinfo/subread:v2.0.1 : version 2.0.1
- R Conteneur evolbioinfo/deseq2:v1.28.1 : R version 4.0.2
- Package R DESeq2 version 1.28.1
- Package R FactoMineR version 2.4
- Package R factoextra version 1.0.7
- Package R EnhancedVolcano version 1.12.0
Pour pouvoir lancer le workflow, assurez-vous que votre machine possède Nextflow et ait au minimum 16 coeurs, 64Go de mémoire vive et 400Go de stockage. Après avoir vérifié que votre environnement de travail est correct, vous pouvez lancer le workflow en vous placant dans le dossier git et en faisant la commande :
nextflow run pipeline.nf
L'utilisation des options -q
et -bg
permettent respectivement d'éviter que la console affiche les messages des étapes d'exécution du workflow et de le lancer en arrière-plan.
Les différents résultats de l'analyse statistique se trouvent dans le dossier results une fois l'exécution terminée.