Skip to main content
QUICK REVIEW

[論文レビュー] Quantification of the effect of mutations using a global probability model of natural sequence variation

Thomas A. Hopf, John Ingraham|arXiv (Cornell University)|Oct 15, 2015
Evolution and Genetic Dynamics参考文献 62被引用数 289
ひとこと要約

本稿では、自然な配列多様性に埋め込まれた進化的制約を活用して、突然変異がタンパク質機能に与える影響を定量化するためのグローバル確率モデルを提案する。進化的制約が自然な配列多様性に埋め込まれていることを活用し、統計的エネルギー関数(進化的ハミルトニアンと呼ばれる)を用いて、特に抗生物質耐性のような進化と類似した選択的圧力下でも高い精度で突然変異の影響を予測する。

ABSTRACT

Modern biomedicine is challenged to predict the effects of genetic variation. Systematic functional assays of point mutants of proteins have provided valuable empirical information, but vast regions of sequence space remain unexplored. Fortunately, the mutation-selection process of natural evolution has recorded rich information in the diversity of natural protein sequences. Here, building on probabilistic models for correlated amino-acid substitutions that have been successfully applied to determine the three-dimensional structures of proteins, we present a statistical approach for quantifying the contribution of residues and their interactions to protein function, using a statistical energy, the evolutionary Hamiltonian. We find that these probability models predict the experimental effects of mutations with reasonable accuracy for a number of proteins, especially where the selective pressure is similar to the evolutionary pressure on the protein, such as antibiotics.

研究の動機と目的

  • 自然な配列多様性データを用いてアミノ酸突然変異の機能的影響を定量化する計算手法を開発すること。
  • タンパク質配列全体における相関するアミノ酸置換をモデル化し、残基位置における進化的制約を推定すること。
  • 特に抗生物質耐性のような選択的圧力下で、実験的に測定された突然変異の影響をこのモデルを用いて予測すること。
  • 進化的パターンとタンパク質配列の機能的結果を結びつける統計的フレームワークを確立すること。
  • 未検証の突然変異の予測精度を、自然変異のグローバルパターンを活用することで向上させること。

提案手法

  • 本手法は、自然なタンパク質配列で訓練されたグローバル確率モデルを用い、各位置におけるアミノ酸置換の尤度を推定する。
  • 最大エントロピーモデルを用いて残基間の対間相関を組み込み、共進化パターンを捉える。
  • 進化的ハミルトニアンは、シーケンスの尤度の負の対数として導出され、突然変異の影響をランク付けする統計的エネルギー関数として機能する。
  • 多様なタンパク質スーパーファミリーにおける進化的制約を反映させるために、大規模な複数配列アラインメントを用いてモデルをキャリブレーションする。
  • 予測精度は、モデルが予測したエネルギー変化と、点突然変異の実験的測定値を比較することで評価される。
  • 本手法は、特に抗生物質耐性タンパク質のように強い選択的圧力にさらされているタンパク質を含め、複数のタンパク質で検証されている。

実験結果

リサーチクエスチョン

  • RQ1自然な配列多様性のグローバル確率モデルは、タンパク質における点突然変異の機能的影響をどの程度正確に予測できるか?
  • RQ2自然な配列多様性に埋め込まれた進化的制約は、実験的に測定された突然変異の影響とどの程度相関するか?
  • RQ3進化的ハミルトニアンは、個々の残基およびそれらの相互作用がタンパク質機能に寄与する割合を定量化するための信頼できる統計的エネルギー関数として機能できるか?
  • RQ4抗生物質耐性のような状況における異なる選択的圧力下で、モデルの性能はどのように変化するか?
  • RQ5実験的アッセイでカバーされていない配列空間の領域における未検証の突然変異の予測力はどの程度か?

主な発見

  • 進化的ハミルトニアンモデルは、自然の進化と類似した選択的圧力下にあるタンパク質において、突然変異の影響を妥当な正確性で予測する。
  • 実験データが入手可能なタンパク質、特に抗生物質耐性に関与するタンパク質において、高い予測正確性を達成している。
  • モデルが捉える残基間相互作用は、単一残基モデルに比べて予測性能を顕著に向上させる。
  • 実験的データがなくても、機能的に重要な残基とそれらの協同的効果を効果的に同定できる。
  • モデルの性能は多様なタンパク質スーパーファミリーにわたり安定しており、未同定の配列への一般化可能性が示された。
  • 本研究では、自然な配列多様性に十分な情報が埋め込まれており、高価な実験的アッセイへの依存を減らすために突然変異の機能的影響を予測可能であることが示された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。