Skip to main content
QUICK REVIEW

[論文レビュー] A Graph Neural Network Approach to Automated Model Building in Cryo-EM Maps

Kiarash Jamali, Dari Kimanius|arXiv (Cornell University)|Sep 30, 2022
Advanced Electron Microscopy Techniques and Applications被引用数 26
ひとこと要約

本論文は ModelAngelo を提示する。これはクライオ-EMのボクセルデータ、タンパク質配列、幾何学的事前情報を統合したグラフニューラルネットワークで、クライオ-EMマップ上の原子モデルを自動的に構築し、3.5 Åを上回るマップに対してほぼ手動と同等の精度を達成する。

ABSTRACT

Electron cryo-microscopy (cryo-EM) produces three-dimensional (3D) maps of the electrostatic potential of biological macromolecules, including proteins. Along with knowledge about the imaged molecules, cryo-EM maps allow de novo atomic modelling, which is typically done through a laborious manual process. Taking inspiration from recent advances in machine learning applications to protein structure prediction, we propose a graph neural network (GNN) approach for automated model building of proteins in cryo-EM maps. The GNN acts on a graph with nodes assigned to individual amino acids and edges representing the protein chain. Combining information from the voxel-based cryo-EM data, the amino acid sequence data and prior knowledge about protein geometries, the GNN refines the geometry of the protein chain and classifies the amino acids for each of its nodes. Application to 28 test cases shows that our approach outperforms the state-of-the-art and approximates manual building for cryo-EM maps with resolutions better than 3.5 Å.

研究の動機と目的

  • 統一されたニューラルフレームワークを使用して、cryo-EMマップ上でデノボの原子モデル構築を自動化する。
  • ボクセルベースの cryo-EM 密度情報を、タンパク質配列情報および幾何学的事前情報と統合する。
  • 約3 Å分解能のマップに対する最先端の自動モデル構築手法を改善する。

提案手法

  • ノードをCα原子とし、エッジがタンパク質鎖に沿うグラフを構築する。バックボーン位置を精緻化し残基を割り当てるようグラフニューラルネットワークを訓練する。
  • Cryo-EM Attention、Sequence Attention、Spatial Invariant Point Attention (IPA) を備えた3モジュール8層のSE(3)等価性GNNを用いて、マップデータ、配列埋め込み、幾何を統合する。
  • 現実的な結合幾何を維持するために、バックボーンフレームの更新とGram-Schmidtに基づくアラインメントを組み込む。
  • Cα RMSD、バックボーン RMSD、アミノ酸分類、ねじれ角、残基ごとの信頼度を含むマルチタスク損失を活用して、エンドツーエンドで訓練する。
  • ペプチド結合のヒューリスティクスを用いて残基を鎖に結合するなどの後処理を行い、提供された配列に対してHMMベースの配列整列を実施し、推定をリサイクルしてモデルを精製する。
  • リサイクルラウンドで訓練し、初期Cα位置をデノイズする。ノイズ付加、シャープニング/ダンピング、ランダム回転でデータを拡張する。

実験結果

リサーチクエスチョン

  • RQ1単一のGNNアーキテクチャが、cryo-EMのボクセルデータ、配列情報、トポロジーを同時に活用して、cryo-EMマップ上のタンパク質モデル構築を自動化できるだろうか?
  • RQ2配列埋め込みとIPAベースの幾何を組み込むことで、マップのみのアプローチと比べて残基同定とバックボーンの精練にどのような影響があるか?
  • RQ33.5 Åより高い分解能のcryo-EMマップにおける、配列リコールとアミノ酸精度の観点で提案手法の性能はどうなるか?
  • RQ4側鎖を含む完全な原子モデルを生成でき、リサイクルやデノイズのような訓練戦略を通じて不確実な残基や欠損残基を扱えるか?
  • RQ5複数のテストケースにおいて、現在の最先端の自動モデル構築ツール(例: DeepTracer)と比べて手法はどうか?

主な発見

  • この手法は、3.5 Åよりも良好なマップに対して手動のモデル構築精度に近いことを示す。
  • 実用的な改善は、マップ単独よりもcryo-EMデータ、配列埋込み、グラフトポロジーを組み合わせることから生じる。
  • アブレーションにより、配列またはIPAモジュールを除くと結果が劣化することが示される。マップのみへの依存はDeepTracerよりも劣る。
  • 後処理後の剪定は一般に配列リコールを低下させず、誤領域の除去を示唆する。
  • ModelAngelo (ModelAngelo) は DeepTracer より遅いが、テストケースでデポジットされたモデルへの整合性がより近い。
  • 28のテストマップを横断して、多モーダル情報の統合とリサイクルベースの精練を用いることで、より高品質なモデルを得られる。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。