プログラム内容
学習内容
- 週1-3:タンパク質データの取得と前処理パイプライン構築
- 週4-6:CNNによる二次構造予測モデルの実装
- 週7-10:注意機構と接触マップ予測
- 週11-14:トランスフォーマーモデルの構築と訓練
- 週15-18:三次元構造生成とエネルギー最小化
- 週19-24:独自モデルの設計と最終プロジェクト
- 技術スタック
- PyTorch、Biopython、NumPy、PyMOL
- 計算環境
- 提供されるクラウドGPU(Tesla V100相当)
- コミット時間
- 週12-15時間


AlphaFoldの登場で構造生物学は大きく変わりました。でも、モデルの中身を理解せずにただ使うだけでは限界があります。このコースでは、注意機構、畳み込みニューラルネットワーク、そしてトランスフォーマーアーキテクチャを使った構造予測の実装を学びます。
PyTorchを使って、配列から二次構造、接触マップ、そして三次元座標を予測するモデルを段階的に構築します。PDB(Protein Data Bank)のデータを前処理し、特徴量エンジニアリングを行い、モデルの訓練から評価までの一連のパイプラインを作ります。
実際に手を動かす時間が中心です。週ごとに小さなモデルを実装し、性能を改善していきます。最終的には、ProteinNet データセットを使って、自分で設計した構造予測モデルを訓練します。計算リソースはクラウドGPU環境を提供します。
前提知識:Pythonでのニューラルネットワーク実装経験、線形代数の基礎、タンパク質化学の基本的な理解。GPUプログラミングの経験は不要です。