Skip to main content
QUICK REVIEW

[論文レビュー] Chemception: A Deep Neural Network with Minimal Chemistry Knowledge Matches the Performance of Expert-developed QSAR/QSPR Models

Garrett B. Goh, Charles Siegel|arXiv (Cornell University)|Jun 20, 2017
Computational Drug Discovery Methods参考文献 45被引用数 115
ひとこと要約

Chemceptionは2D分子図の画像のみを用いて深層CNNを直接訓練し、明示的な化学特徴量なしで、いくつかの特性において専門家開発のQSAR/QSPRモデルと同等またはやや上回る。

ABSTRACT

In the last few years, we have seen the transformative impact of deep learning in many applications, particularly in speech recognition and computer vision. Inspired by Google's Inception-ResNet deep convolutional neural network (CNN) for image classification, we have developed "Chemception", a deep CNN for the prediction of chemical properties, using just the images of 2D drawings of molecules. We develop Chemception without providing any additional explicit chemistry knowledge, such as basic concepts like periodicity, or advanced features like molecular descriptors and fingerprints. We then show how Chemception can serve as a general-purpose neural network architecture for predicting toxicity, activity, and solvation properties when trained on a modest database of 600 to 40,000 compounds. When compared to multi-layer perceptron (MLP) deep neural networks trained with ECFP fingerprints, Chemception slightly outperforms in activity and solvation prediction and slightly underperforms in toxicity prediction. Having matched the performance of expert-developed QSAR/QSPR deep learning models, our work demonstrates the plausibility of using deep neural networks to assist in computational chemistry research, where the feature engineering process is performed primarily by a deep learning algorithm.

研究の動機と目的

  • 明示的な化学知識や記述子を使わず、2D分子図の画像だけを用いて化学特性を予測できる深層畳み込みニューラルネットワークが実現可能かを評価する。
  • 毒性、活性、溶媒和タスクにおいて、専門家開発のQSAR/QSPRモデル(ECFPフィンガープリントを用いたMLP)とChemceptionを比較する。
  • おおよそ600件から40,000件程度のデータセット範囲で性能を評価する。

提案手法

  • Inception-ResNetに触発された深層CNNで、2D分子図を入力として動作するChemceptionを開発する。
  • 明示的な化学概念や記述子を使用せず、適度なデータセットでモデルを訓練する。
  • ECFPフィンガープリントを使用する多層パーセプトロン(MLP)ネットワークと比較 benchmark する。
  • 毒性、活性、溶媒和予測タスクで評価し、性能のギャップと類似点を評価する。

実験結果

リサーチクエスチョン

  • RQ12D分子図のみを用いて訓練された深層CNNは、設計された記述子に依存する専門のQSAR/QSPRモデルと同等の性能を達成できるか。
  • RQ2記述子ベースのMLPモデルと比較して、毒性、活性、溶媒和タスクにおけるChemceptionの性能はどうか。
  • RQ3QSAR/QSPRの文脈で、最小限の化学知識で正確な性質予測が可能か。

主な発見

  • Chemceptionは活性および溶媒和予測でECFPフィンガープリントを用いたMLPをやや上回る。
  • Chemceptionは毒性予測ではECFPフィンガープリントを用いたMLPにわずかに及ばない。
  • Chemceptionは最小限の化学知識を用いた専門開発QSAR/QSPR深層学習モデルの性能と同等である。
  • このアプローチは、深層学習が化学特性予測のための特徴量設計を大部分を暗黙のうちに実行できることを示している。
  • 本研究は約600件から40,000件の化合物データセットを使用している。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。