中級者向け - プログラミング実務経験1年以上推奨

ゲノム解析パイプラインの設計と運用

受講料 ¥295,000
残席数 5
ゲノム解析パイプラインの設計と運用

プログラム内容

カリキュラム

  • 週1-2:バイオインフォマティクスツールの理解とベストプラクティス
  • 週3-5:Nextflowによるパイプライン基礎と実装
  • 週6-8:Dockerコンテナ化と環境管理
  • 週9-11:全ゲノムシーケンス解析パイプラインの構築
  • 週12-14:クラウド環境での実行とコスト最適化
  • 週15-16:性能チューニングと本番運用
実習環境
ローカル + AWS/GCPクラウドリソース提供
扱うデータ
WGS、WES、RNA-seq(実データ使用)
納品物
稼働可能な解析パイプライン一式

詳細説明

シーケンスデータが増え続けて、手作業での解析が追いつかなくなっていませんか。100サンプルを超えると、スクリプトの管理だけで大変です。このプログラムでは、Nextflow、Snakemake、CWLを使った再現可能な解析パイプラインの構築方法を学びます。

FASTQファイルの品質管理から、アライメント、バリアントコール、アノテーションまでの全工程を自動化します。エラーハンドリング、ログ管理、リソース最適化も含まれています。Docker、Singularityを使った環境の標準化により、どこでも同じ結果が得られるパイプラインを作ります。

実際のプロジェクトでは、TCGA(The Cancer Genome Atlas)の全ゲノムシーケンスデータを使い、体細胞変異検出パイプラインを構築します。クラスターでの並列実行、AWSやGCPでのクラウド実行にも対応します。

Bash、Python、そしてLinuxコマンドラインの実務経験があることが前提です。HPC環境やクラウドの知識は、コース内で必要な部分を扱います。