ARTIC SARS-CoV-2 ワークフローでゲノム解析を効率化
この記事では、epi2me-labsが開発したARTIC SARS-CoV-2ワークフロー(wf-artic)について解説します。このワークフローは、Oxford Nanopore Technologiesのデバイスで生成されたデータを用いて、SARS-CoV-2ゲノム配列を解析し、コンセンサス配列を生成するために設計されています。
ARTIC SARS-CoV-2ワークフローとは?
wf-articは、多重化されたMinION、GridION、およびPromethIONデータ上でARTIC SARS-CoV-2プロトコルを実行するためのワークフローです。 プールされたタイリングアンプリコン戦略を使用したDNAシーケンスから、SARS-CoV-2ゲノムのコンセンサス配列を作成するために、ARTIC FieldBioinformaticsワークフローをわずかに修正したものが実装されています。
ワークフローの利点
- 効率的なゲノム解析: プールされたタイリングアンプリコン戦略により効率よくSARS-CoV-2ゲノムを解析。
- 多様なデータソースに対応: MinION、GridION、PromethIONなど、多様なNanoporeシーケンサーのデータを処理可能。
- 自動化された解析: nextflowを使用することで、計算資源とソフトウェアリソースの管理を自動化。
必要な計算リソース
- 推奨: CPU 4コア、メモリ 8GB。
- 最低限: CPU 2コア、メモリ 4GB。
- 実行時間: サンプルあたり約5分。
インストールと実行方法
ワークフローはコマンドラインまたはEPI2MEアプリケーションから利用できます。 インストールと実行には、nextflowが必要です。DockerまたはSingularityを使用することで、必要なソフトウェアの分離と自動化が可能です。
実行例:
入力パラメータの詳細
ワークフローには、様々なオプションを設定できます。
入力オプション
fastq
: FASTQファイルのパス。 シングル、ディレクトリ、サブディレクトリ構造に対応。analyse_unclassified
: 未分類のリードを解析するかどうか(デフォルト: False)。basecaller_cfg
: 参照するMedakaモデルを選択するためのbasecaller構成の名前。指定がない場合のデフォルト値はdna_r9.4.1_450bps_hac
です。
プライマースキームの選択
scheme_name
: プライマースキーム名(例: SARS-CoV-2, spike-seq)。scheme_version
: プライマースキームのバージョン(例: ARTIC/V3)。custom_scheme
: カスタムスキームへのパス。
サンプルオプション
sample_sheet
: バーコードとサンプルエイリアスを対応付けるCSVファイル。sample
: 非多重化データ用のサンプル名。
出力オプション
out_dir
: 出力ディレクトリ(デフォルト: output)。
出力ファイルの解説
ワークフローは、以下のファイルを出力します。
wf-artic-report.html
: 全サンプルの解析レポート。all_consensus.fasta
: 全サンプルのコンセンサス配列。lineage_report.csv
: Pangolinによる系統解析結果。nextclade.json
: Nextcladeによるクレード解析結果。all_depth.txt
: 全サンプルのカバレッジデータ。{{ alias }}.pass.named.vcf.gz
: サンプルの変異情報(VCF形式)。{{ alias }}.pass.named.vcf.gz.tbi
: 変異情報のインデックスファイル。
関連プロトコル
このワークフローは、Oxford Nanopore Technologiesのデバイスで生成されたシーケンスデータを使用するように設計されています。 Midnightプロトコルは、サンプル調製とシーケンスに関する詳細な手順を提供します。
FAQ
- Q: ワークフローが対応するプライマースキームは?
- A: SARS-CoV-2、spike-seq、およびカスタムスキームに対応しています。
- Q: シングルエンドとペアエンドのFASTQファイルの両方に対応していますか?
- A: ドキュメントには記載がありません。
まとめ
epi2me-labsのwf-articワークフローは、ARTICプロトコルを用いたSARS-CoV-2ゲノム解析を効率化するための強力なツールです。 適切なパラメータ設定と利用により、迅速かつ正確なゲノム情報の取得が可能となり、感染症研究に大きく貢献するでしょう。