Guide Ultime pour l'Analyse du SARS-CoV-2 avec le Workflow ARTIC : Boostez Votre Recherche Virologique
Découvrez comment le workflow ARTIC (epi2me-labs/wf-artic) simplifie l'analyse du SARS-CoV-2 à partir de données MinION, GridION et PromethION multiplexées. Optimisez votre recherche virologique et obtenez des résultats précis en un temps record.
Pourquoi Utiliser le Workflow ARTIC pour l'Analyse du SARS-CoV-2 ?
Le workflow ARTIC offre une approche optimisée pour la préparation de séquences consensus à partir de génomes de SARS-CoV-2. Il utilise une stratégie d'amplification par tiling multiplexée et offre une méthodologie légèrement modifiée d'ARTIC FieldBioinformatics.
- Simplification du processus: Un workflow clair pour la préparation de séquences consensus.
- Adaptabilité: Compatible avec des données issues de différentes plateformes (MinION, GridION, PromethION).
- Personnalisation: Possibilité de spécifier le schéma d'amorces utilisé lors de l'amplification génomique et de la préparation de la librairie.
Configuration Requise : Optimisez Votre Environnement de Calcul
Assurez-vous de posséder les ressources de calcul minimales pour une analyse efficace. Voici les exigences pour exécuter le workflow ARTIC :
- Minimum: 2 CPUs et 4GB de mémoire.
- Recommandé: 4 CPUs et 8GB de mémoire.
- Temps d'exécution approximatif: 5 minutes par échantillon.
Installation Facile et Exécution Rapide avec Nextflow
Le workflow ARTIC est géré par nextflow, nécessitant son installation préalable. Utilisez Docker ou Singularity pour isoler l'environnement logiciel et automatiser l'exécution.
- Installation sans effort: Pas besoin de cloner ou télécharger le dépôt Git.
- Flexibilité: Exécutez le workflow via la ligne de commande ou l'application EPI2ME.
- Commande d'aide:
nextflow run epi2me-labs/wf-artic -–help
pour obtenir la liste des paramètres disponibles.
Testez le Workflow avec le Jeu de Données de Démonstration
Un jeu de données de démonstration est disponible pour tester le workflow et vous familiariser avec son fonctionnement.
Exécutez le workflow avec les données de démonstration :
Protocoles Associés: Maximisez la Qualité de Vos Séquences
Le workflow ARTIC est conçu pour traiter des séquences issues des appareils Oxford Nanopore Technologies.
- Protocole Midnight : disponible dans la Nanopore community.
Options d'Entrée: Flexibilité Maximale pour Vos Données FASTQ
Le workflow ARTIC accepte différents formats d'entrée FASTQ, offrant une grande flexibilité.
- (i) Chemin vers un seul fichier FASTQ.
- (ii) Chemin vers un répertoire contenant des fichiers FASTQ.
- (iii) Chemin vers un répertoire contenant des sous-répertoires (barcodes) contenant des fichiers FASTQ.
Dans les cas (i) et (ii), spécifiez un nom d'échantillon avec --sample
. Dans le cas (iii), utilisez --sample_sheet
pour un fichier CSV mappant les barcodes aux alias d'échantillons.
Exemples de structure d'entrée:
(i) (ii) (iii)
input_reads.fastq ─── input_directory ─── input_directory
├── reads0.fastq ├── barcode01
└── reads1.fastq │ ├── reads0.fastq
│ └── reads1.fastq
├── barcode02
│ ├── reads0.fastq
│ ├── reads1.fastq
│ └── reads2.fastq
└── barcode03
└── reads0.fastq
Paramètres d'Entrée: Contrôle Précis de Votre Analyse
Le workflow ARTIC offre de nombreux paramètres d'entrée pour un contrôle précis de votre analyse.
--fastq
: Fichiers FASTQ à utiliser (chemin vers un fichier, répertoire ou répertoire de sous-répertoires).--analyse_unclassified
: Analyse des lectures non classifiées.--basecaller_cfg
: Nom du modèle utilisé pour le basecalling, pour sélectionner un modèle Medaka approprié.
Sélection du Schéma d'Amorces: Adaptez l'Analyse à Votre Protocole
Choisissez le schéma d'amorces approprié pour garantir une analyse précise.
--scheme_name
: Nom du schéma d'amorces (SARS-CoV-2
,spike-seq
ou un schéma personnalisé).--scheme_version
: Version du schéma d'amorces (ex:ARTIC/V3
).--custom_scheme
: Chemin vers un schéma d'amorces personnalisé.
Options d'Échantillon et de Sortie: Personnalisez Vos Résultats
Ajustez les paramètres pour personnaliser les résultats de votre analyse.
--sample_sheet
: Fichier CSV pour mapper les barcodes aux alias d'échantillons.--sample
: Nom d'échantillon pour les données non multiplexées.--out_dir
: Répertoire de sortie pour tous les résultats.
Options de Rapport: Visualisez et Interprétez Facilement Vos Données
Configurez les options de rapport pour obtenir une vue d'ensemble claire et informative de vos résultats.
--report_depth
: Profondeur minimale pour le pourcentage de couverture.--report_clade
: Afficher les résultats de l'analyse Nextclade.--report_coverage
: Afficher les traces de couverture du génome.--report_lineage
: Afficher les résultats de l'analyse Pangolin.--report_variant_summary
: Afficher les informations sur les variants.
Options Avancées et Diverses: Contrôle Expert de Votre Analyse
Des options avancées pour un contrôle fin de votre analyse, comme le nombre de threads utilisés, les options Pangolin et Nextclade, etc.
--artic_threads
: Nombre de threads CPU par tâche ARTIC.--pangolin_threads
: Nombre de threads CPU par tâche Pangolin--update_data
: Mettre à jour les données Pangolin et Nextclade.--medaka_variant_model
: Forcer manuellement le modèle de variant Medaka à utiliser, en remplacement de la détection automatique en fonction du basecaller.
Sorties: Obtenez des Résultats Clairs et Précis
Le workflow ARTIC génère des fichiers de sortie clairs et précis, essentiels pour votre analyse.
./wf-artic-report.html
: Rapport pour tous les échantillons../all_consensus.fasta
: Séquences consensus finales../lineage_report.csv
: Résultats Pangolin../nextclade.json
: Résultats Nextclade../all_depth.txt
: Couverture du génome de référence../{{ alias }}.pass.named.vcf.gz
: Fichier VCF contenant les variants de haute confiance.
En utilisant ce guide, vous optimiserez votre flux de travail d'analyse du SARS-CoV-2 avec le workflow ARTIC, améliorant la précision et l'efficacité de vos recherches.