[論文レビュー] Using Sequence Alignments to Predict Protein Structure and Stability With High Accuracy
本稿では、複数配列アラインメントを用いてタンパク質内の残基間相互作用を推定する最大エントロピー・ボルツマンネットワークモデルを提案する。このモデルにより、タンパク質構造の接触予測および突然変異に起因する自由エネルギー変化の高精度な予測が可能となり、全配列位置における相関進化パターンをモデル化することで、二重相関を越えた長距離協同効果を捉えることができる。実験的安定性および構造的データと強い整合性を示している。
We present a sequence-based probabilistic formalism that directly addresses co-operative effects in networks of interacting positions in proteins, providing significantly improved contact prediction, as well as accurate quantitative prediction of free energy changes due to non-additive effects of multiple mutations. In addition to these practical considerations, the agreement of our sequence-based calculations with experimental data for both structure and stability demonstrates a strong relation between the statistical distribution of protein sequences produced by natural evolutionary processes, and the thermodynamic stability of the structures to which these sequences fold.
研究の動機と目的
- タンパク質内のアミノ酸位置間における協同的かつネットワーク的相互作用を、孤立した二重相関を越えて捉える、配列に基づく形式的枠組みの構築を目的とする。
- 自然な配列変異のみを用いて、複数突然変異に起因するタンパク質の接触マップおよび自由エネルギー変化を定量的に高精度に予測することを目的とする。
- 自然に進化したタンパク質配列の統計的分布が、その折りたたまれた構造の下位にある熱力学的安定性および構造的制約を反映していることを示すこと。
- 進化的配列データから物理的相互作用パラメータを推定する、厳密な逆統計力学フレームワークの提供を目的とする。
- 推定されたエネルギー・モデルを用いて、シーケンス空間を探索することで、自然界に存在しない新規の安定したタンパク質配列の設計を可能とすること。
提案手法
- 各残基位置を20種類の状態(アミノ酸)を取るスピンとして扱い、相互作用を未知の物理的パラメータで定義する。
- 最大エントロピー原理を適用し、アラインメントから観測された単一および二重アミノ酸頻度と一致する全長配列の確率分布を導出する。
- 得られたエネルギー関数(式2)には、部位特異的および二重相互作用パラメータ(λ)が含まれており、これらは経験的配列頻度にフィットすることで推定される。
- 推定されたエネルギー・モデルを用いて、強く相関する残基ペアを特定することで接触マップを予測し、複数突然変異に起因するΔG変化を推定する。
- シミュレーテッド・アンネalingに変更されたLamスケジュールを用いて、膨大なシーケンス空間(例:20^11シーケンス)を探索し、高安定性なコア配列を同定する。
- Fyn SH3ドメインの突然変異体の実験的融解温度データと照合して予測を検証する。
実験結果
リサーチクエスチョン
- RQ1配列アラインメントに基づく統計的モデルは、折りたたまれたタンパク質構造においてどの残基ペアが空間的に近接しているかを高精度に予測できるか?
- RQ2複数突然変異の協同的で加法的でない効果は、進化的配列共変動パターンからどの程度予測可能か?
- RQ3自然な配列データから推定されたエネルギー・モデルは、実験的に測定されたタンパク質安定性(例:融解温度)とどの程度相関するか?
- RQ4推定されたエネルギー関数を用いてシーケンス空間を探索することで、自然界に存在しない新規の安定したタンパク質配列を同定できるか?
- RQ5自然タンパク質配列の統計的分布は、その折りたたまれた構造の下位にある熱力学的安定性を反映しているか?
主な発見
- 本手法は、Fyn SH3ドメインにおける残基接触の予測において高い精度を達成し、二重相関のみを考慮する手法を上回る。長距離協同効果を捉えることができた。
- 複数突然変異に起因する予測された自由エネルギー変化(ΔG)は、実験的に測定された融解温度と強く相関しており(R² ≈ 0.8)、良好な一致を示した。
- Fyn SH3の位置26、39、50における20³の全トリプレット突然変異の計算的サーベイでは、実験的に観察された範囲内に予測融解温度を有する50の配列が同定された。
- Fyn SH3の疎水性コア部における20¹¹の探索空間内で最も安定な50の配列のうち、26が元のアラインメント(自然配列)に存在しており、モデルの予測能力が妥当であることが裏付けられた。
- 本モデルは、自然界に存在しない新規で高安定性の配列を成功裏に予測した。特に、融解温度が84.9 °Cに達する配列も同定された。
- 解析により、アラインメント内でレアアミノ酸を示す配列はλパラメータの推定が不確実であり、有意義な予測の対象外となる傾向にあり、モデルの強靭性と限界が浮き彫りになった。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。