プログラム内容
プログラム構成
- 週1-4:Pythonによる配列データ処理とBiopythonの実践
- 週5-8:統計解析の基礎とデータ可視化技術
- 週9-12:機械学習入門と分類アルゴリズムの実装
- 週13-16:RNA-seqデータ解析とディープラーニング基礎
- 週17-20:最終プロジェクト - がんゲノムデータ解析
- 形式
- 週2回のライブセッション(各2時間)+ 自習課題
- 期間
- 20週間
- 使用言語
- Python中心、R基礎


生物学のバックグラウンドがあるけれど、データ解析で行き詰まっていませんか。配列データを扱うPythonスクリプトの書き方から、機械学習モデルを使った遺伝子発現パターンの解析まで、実際のデータセットを使って学びます。
最初の4週間はBiopythonとPandasを使った配列解析とデータ処理。その後、scikit-learnで分類問題に取り組みます。NCBI、UniProt、ENSEMBLといった主要データベースからのデータ取得方法も含まれています。
このプログラムでは、RNA-seqデータの前処理、差次的発現解析、そして予測モデルの構築までカバーします。最終課題では、公開されているがんゲノムデータを使って変異パターンを分析し、予後予測モデルを作成します。
扱うツール:Python、Jupyter Notebook、scikit-learn、Biopython、R(基礎のみ)。実験データの扱いに慣れている方なら、プログラミング初心者でも問題ありません。