[論文レビュー] Uncovering Biological Network Function via Graphlet Degree Signatures
本論文は、PPIネットワーク内のタンパク質ネighborhoodのトポロジー的類似性を分析することにより、生物学的ネットワーク機能を解明するためのグラフレット次数シグネチャ(GDS)を導入する。2〜5ノードのグラフレットを用いた局所的ネットワーク構造の比較により、同じ機能、局在、複合体への参加を示すタンパク質クラスタを同定し、タンパク質複合体への参加予測で最大100%のヒットレートを達成するとともに、未分類のイーストタンパク質の正確な機能アノテーションを可能にする。
Proteins are essential macromolecules of life and thus understanding their function is of great importance. The number of functionally unclassified proteins is large even for simple and well studied organisms such as baker's yeast. Methods for determining protein function have shifted their focus from targeting specific proteins based solely on sequence homology to analyses of the entire proteome based on protein-protein interaction (PPI) networks. Since proteins aggregate to perform a certain function, analyzing structural properties of PPI networks may provide useful clues about the biological function of individual proteins, protein complexes they participate in, and even larger subcellular machines. We design a sensitive graph theoretic method for comparing local structures of node neighborhoods that demonstrates that in PPI networks, biological function of a node and its local network structure are closely related. The method groups topologically similar proteins under this measure in a PPI network and shows that these protein groups belong to the same protein complexes, perform the same biological functions, are localized in the same subcellular compartments, and have the same tissue expressions. Moreover, we apply our technique on a proteome-scale network data and infer biological function of yet unclassified proteins demonstrating that our method can provide valuable guidelines for future experimental research.
研究の動機と目的
- PPIネットワークにおける局所的ネットワークトポロジーと生物学的機能、タンパク質複合体、細胞小器官局在の間の強固な関連を確立すること。
- 特にベーカーズイーストのようなよく研究された生物における、プロテオーム規模のネットワークにおける未特徴化タンパク質の機能予測という課題に応えること。
- 密度や接続性のみに依存するのではなく、ネIGHBORHOODの構造的類似性に基づいてタンパク質をクラスタリングするトポロジーに基づくクラスタリング手法を開発すること。
- 異なる生物(イーストおよびヒト)および多様なPPIネットワークデータソース(ハイフライトおよび小規模なデータを含む)において、この手法の妥当性を検証すること。
- 未分類タンパク質の機能アノテーションのためのスケーラブルで並列処理可能な計算フレームワークを提供し、今後の実験的研究を支援すること。
提案手法
- 本手法は、すべての連結された2〜5ノードのグラフレット(部分グラフ)を用いて、各ノードのグラフレット次数シグネチャ(GDS)を計算し、各ノードが各グラフレットタイプに何回出現するかを捉える。
- ノード間の類似性は、GDSベクトルを[0, 1]の正規化類似度スコアで比較することで測定され、スコアが高いほどトポロジカルに類似したネIGHBORHOODを示す。
- GDS類似度に基づいてタンパク質がクラスタリングされ、高いトポロジカルおよび機能的整合性を持つグループが形成される。
- 機能予測には厳密な方針と柔軟な方針の両方が適用される。柔軟な方針では、アノテートされた機能にわずかな不一致を許容することで、より高いヒットレートを達成できる。
- アルゴリズムは計算的に高負荷(O(|V|⁵))であるが、並列処理が可能であるため、大規模なPPIネットワークへのスケーラビリティが確保される。
- グラフレットベースのトポロジー解析に根拠を置いているため、PPIに限らず、他の生物学的および実世界のネットワークに対しても一般化可能である。
実験結果
リサーチクエスチョン
- RQ1PPIネットワークにおけるタンパク質のネIGHBORHOODの局所的トポロジー構造は、その生物学的機能をどの程度まで予測可能であるか?
- RQ2タンパク質ネIGHBORHOOD構造のトポロジカル類似性は、同じタンパク質複合体、機能的カテゴリー、細胞小器官領域にグループ化することを信頼性高く可能にするか?
- RQ3グラフレット次数シグネチャは、従来のネIGHBORHOODベースまたはクラスタリングベースの機能予測手法に比べ、精度および感度において優れているか?
- RQ4この手法は、特にベーカーズイーストにおいて、プロテオームスケールのネットワークにおける未分類タンパク質の機能をどの程度正確に予測できるか?
- RQ5ネットワークトポロジーと生物学的機能の関係は、異なる生物およびPPIネットワークタイプ(例:ハイフライト対小規模)において保存されているか?
主な発見
- vonMeringコアPPIネットワークでは、柔軟なスケームを用いた場合、44%のクラスタでタンパク質複合体への参加予測が100%のヒットレートを達成し、本手法の正確性が裏付けられた。
- 度数>4の未分類イーストタンパク質に対して、厳密なスケームでは17件中14件、柔軟なスケームでは17件中16件で50%以上の予測ヒットレートを達成した。
- 未特徴化のPWP1タンパク質がrRNA処理に関与していると本手法が正しく予測したことは、SGDにおけるその既知の機能と整合的であった。
- GDS類似度でグループ化されたタンパク質は、イーストおよびヒトネットワークの両方で、共通の生物学的機能、細胞小器官局在、および臓器発現の両面で有意に豊富であった。
- 本手法は、TAPおよびHMS-PCIのハイフライト法から得られたネットワークを含む、多様なPPIネットワークにおいても頑健であった。これらの手法はタンパク質複合体を豊富に含むことで知られている。
- クラスタのミスレートは低く、クラスタ内のアノテート済みノードのわずかな割合しか、他のノードと共通の機能を持たないことが確認され、予測クラスタの高い機能的整合性が示された。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。