[論文レビュー] Chemi-net: a graph convolutional network for accurate drug property prediction
Chemi-Net は、ドメイン固有の記述子やフィンガープrintを用いない、グラフ畳み込みニューラルネットワーク(GCN)に基づく深層学習モデルであり、薬物の吸収、分布、代謝、排泄(ADME)特性を予測する。分子グラフ上でエンドツーエンドに訓練された本モデルは、アムジェン社で広く使われている業界標準手法であるCubistを大きく上回り、実世界の比較研究において予測精度を顕著に向上させた。
Absorption, distribution, metabolism, and excretion (ADME) studies are critical for drug discovery. Conventionally, these tasks, together with other chemical property predictions, rely on domain-specific feature descriptors, or fingerprints. Following the recent success of neural networks, we developed Chemi-Net, a completely data-driven, domain knowledge-free, deep learning method for ADME property prediction. To compare the relative performance of Chemi-Net with Cubist, one of the popular machine learning programs used by Amgen, a large-scale ADME property prediction study was performed on-site at Amgen. The results showed that our deep neural network method improved current methods by a large margin. We foresee that the significantly increased accuracy of ADME prediction seen with Chemi-Net over Cubist will greatly accelerate drug discovery.
研究の動機と目的
- 手作業で作成された化学フィンガープrintやドメイン特化の記述子に依存しない薬物特性予測のための深層学習モデルの開発。
- 産業的ドラッグディスカバリーパラダイムで使用されている機械学習手法を上回るADME特性予測の精度向上。
- 分子構造のグラフ構造データから直接、分子表現を学習する完全にデータ駆動型でエンドツーエンドで訓練可能なフレームワークの構築。
- 実世界の環境(アムジェン社内)で、最先端の業界標準手法(Cubist)と比較して本モデルの性能を検証すること。
提案手法
- Chemi-Net は、原子をノード、結合をエッジとする分子グラフを処理するためのグラフ畳み込みネットワーク(GCN)を採用している。
- ノード表現を隣接原子からの情報を集約することで反復的に更新するメッセージパッシングメカニズムを用いている。
- 局所的な分子サブ構造や分子グラフ全体における階層的な構造パターンを捉えるために、学習可能なフィルタを適用している。
- 全原子レベルの表現に対するグローバルプーリングによって、最終的な分子表現を取得している。
- 最終的な予測ヘッドは、プールされた分子埋め込み表現からADME特性を出力するために全結合層を用いている。
- 回帰タスクの標準的な誤差二乗平均(MSE)損失関数を用いて、バックプロパゲーションによるエンドツーエンドの訓練が実施されている。
実験結果
リサーチクエスチョン
- RQ1グラフ畳み込みネットワーク(GCN)に基づく深層学習モデルは、従来の機械学習手法に比べ、ADME特性の予測において優れていると言えるか?
- RQ2データ駆動型で特徴量フリーなアプローチは、実世界のドラッグディスカバリーフレームワークにおいて、Cubist などの業界標準ツールに匹敵またはそれを上回る性能を発揮できるか?
- RQ3化学的フィンガープrintを一切使用せずに、分子グラフから直接意味のある分子表現を学習できるか?
- RQ4分子グラフ上でエンドツーエンドに訓練することで、薬物特性予測における一般化性能と予測精度が向上するか?
主な発見
- Chemi-Net は、大規模かつ現地でのADME特性予測研究において、アムジェン社で広く使われているCubistを著しく上回った。
- Cubist に比べて予測精度が著しく向上し、ADME特性予測におけるGCNベースの表現学習の有効性が裏付けられた。
- 複数のADME関連特性にわたり一貫した性能向上が確認され、本手法の広範な適用可能性が示された。
- 結果から、Chemi-Net のデータ駆動型でドメインに依存しないアプローチが、より正確な初期段階の特性予測を可能にすることで、ドラッグディスカバリを加速できる可能性がある。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。