[論文レビュー] AtomNet: A Deep Convolutional Neural Network for Bioactivity Prediction in Structure-based Drug Discovery
AtomNetは、3次元分子構造における空間的局所性と階層的特徴構成を活用して結合親和性を予測する、構造ベースの生物活性予測のための最初の深層畳み込みニューラルネットワークである。従来のドッキング手法を上回り、DUDEベンチマークの57.8%のターゲットでAUC > 0.9を達成し、既知の調節因子のないターゲットに対してもアクティブな化合物を効果的に同定した。
Deep convolutional neural networks comprise a subclass of deep neural networks (DNN) with a constrained architecture that leverages the spatial and temporal structure of the domain they model. Convolutional networks achieve the best predictive performance in areas such as speech and image recognition by hierarchically composing simple local features into complex models. Although DNNs have been used in drug discovery for QSAR and ligand-based bioactivity predictions, none of these models have benefited from this powerful convolutional architecture. This paper introduces AtomNet, the first structure-based, deep convolutional neural network designed to predict the bioactivity of small molecules for drug discovery applications. We demonstrate how to apply the convolutional concepts of feature locality and hierarchical composition to the modeling of bioactivity and chemical interactions. In further contrast to existing DNN techniques, we show that AtomNet's application of local convolutional filters to structural target information successfully predicts new active molecules for targets with no previously known modulators. Finally, we show that AtomNet outperforms previous docking approaches on a diverse set of benchmarks by a large margin, achieving an AUC greater than 0.9 on 57.8% of the targets in the DUDE benchmark.
研究の動機と目的
- リガンドおよびターゲットの3次元構造情報を用いて分子の生物活性を予測する深層学習モデルの開発。
- 既知のアクティブ化合物に依存し、ターゲット構造の文脈を欠如させるリガンドベースのモデルの限界を克服すること。
- ターゲット構造を学習プロセスに組み込むことで、以前に知られていた調節因子のないターゲットに対しても、新規のアクティブな化合物を予測可能にする。
- 畳み込みニューラルネットワークが、分子結合における局所的かつ空間的に制限された化学的相互作用を効果的にモデル化できることを示すこと。
- DUDEやChEMBLなどの標準ベンチマークで、Smina や商業的メソッドなどの既存のドッキングツールを上回ることを実証すること。
提案手法
- AtomNetは、リガンドおよびターゲットタンパク質内の原子の空間的配置を表す3次元グリッドを処理する3次元畳み込みニューラルネットワーク(3D-CNN)アーキテクチャを採用する。
- 局所的で重みが共有されたフィルタを用いて、水素結合やπスターリングなどの近接化学的特徴を検出することで、パラメータ共有と一般化性能の向上を実現する。
- 局所的特徴の階層的構成により、複数の層を経て、分子相互作用のより複雑な表現を学習可能となる。
- 入力データは、各ボクセルが原子種別、部分電荷、空間座標を表す3次元ボクセルグリッドとして符号化され、空間的認識能力が確保される。
- 各リガンド-ターゲットペアの結合親和性(アクティブ/非アクティブ)を予測するために、バイナリクロスエントロピー損失を用いたマルチタスク学習設定でエンドツーエンドに訓練される。
- フィルタの可視化は、フィルタが最も強く反応する入力領域を特定することで実施され、直接的なフィルタ可視化なしに学習された化学的機能の解釈が可能となる。
実験結果
リサーチクエスチョン
- RQ1深層畳み込みニューラルネットワークは、タンパク質-リガンド結合における分子的相互作用の空間的局所性を効果的にモデル化できるか?
- RQ2ターゲットタンパク質の3次元構造情報を組み込むことで、既知の調節因子のないターゲットの生物活性予測が向上するか?
- RQ3標準ベンチマークで、3D-CNNアーキテクチャは従来のドッキングツールを上回ってリガンド結合親和性を予測できるか?
- RQ4フィルタの活性化パターンを通じて、モデルは機能的基団(例:スルホニル/スルホアミド基)などの化学的に意味のある特徴を自律的に発見できるか?
- RQ5AtomNetは、以前にアクティブなリガンドが知られていないターゲットに対してもどの程度一般化できるか?
主な発見
- AtomNetは、DUDEベンチマークの57.8%のターゲットでAUCが0.9を超えることを達成し、従来のドッキング手法を著しく上回った。
- DUDE-102ベンチマークでは、AtomNetの平均AUCは0.895、平均logAUCは0.385であったのに対し、DOCK3.7はそれぞれ0.696および0.174であった。
- AtomNetは、既知の調節因子のないターゲットに対してもアクティブな化合物を効果的に予測し、データが乏しい状況下での一般化能力を示した。
- フィルタの可視化により、学習されたフィルタが事前の化学的知識なしにスルホニル/スルホアミド基などの特定の化学的機能を検出していることが判明した。
- ChEMBL-20 PMDベンチマークでは、AtomNetは50のターゲットのうち27つでAUCの閾値を超過したが、Sminaは16つにとどまった。
- ChEMBL-20の非アクティブ化合物ベンチマークでは、AtomNetは149のターゲットのうち107つで調整済みlogAUC ≥ 0.3を達成したのに対し、Sminaは35つであった。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。