QUICK REVIEW

[論文レビュー] Toxicity Prediction using Deep Learning

Thomas Unterthiner, Andreas Mayr|arXiv (Cornell University)|Mar 4, 2015

Computational Drug Discovery Methods参考文献 31被引用数 92

ひとこと要約

この論文は、専門家が設計したトキシコフォアに類似する化学的特徴を自動で学習する深層学習手法を提示する。ECFP4フォルダープリントを用いた深層ニューラルネットワークを採用し、Tox21 Data Challengeにおいて、すべての手法を上回り、3つのパネル（含むグランドチャンレンジ）で優勝し、15のサブチャレンジにおいて最先端の性能を達成した。

ABSTRACT

Everyday we are exposed to various chemicals via food additives, cleaning and cosmetic products and medicines -- and some of them might be toxic. However testing the toxicity of all existing compounds by biological experiments is neither financially nor logistically feasible. Therefore the government agencies NIH, EPA and FDA launched the Tox21 Data Challenge within the "Toxicology in the 21st Century" (Tox21) initiative. The goal of this challenge was to assess the performance of computational methods in predicting the toxicity of chemical compounds. State of the art toxicity prediction methods build upon specifically-designed chemical descriptors developed over decades. Though Deep Learning is new to the field and was never applied to toxicity prediction before, it clearly outperformed all other participating methods. In this application paper we show that deep nets automatically learn features resembling well-established toxicophores. In total, our Deep Learning approach won both of the panel-challenges (nuclear receptors and stress response) as well as the overall Grand Challenge, and thereby sets a new standard in tox prediction.

研究の動機と目的

生物学的に不切実な高スループットスクリーニングを超えてスケーリング可能な計算手法を、化学毒性予測のため開発すること。
手作業で設計された記述子に依存するか、既知の3次元構造を必要とする従来の構造ベースおよびリガンドベース手法の限界を克服すること。
深層学習を毒性予測に応用し、これまで未使用であった分野において、自動特徴学習の可能性を評価すること。
深層ニューラルネットワークが、化学フォルダープリントから直接、トキシコフォアなどの意味のある生物学的関連特徴を学習できることを示すこと。
複数の生物学的経路とアッセイをカバーするTox21 Data Challengeにおいて、優れた性能を達成すること。

提案手法

化学化合物の部分構造フラグメントを符号化するECFP4フォルダープリントを用いてトレーニングした深層ニューラルネットワークを採用した。
階層的特徴学習を実施：低レベルのECFP4特徴が深い層で組み合わされ、反応性中心を経て最終的にトキシコフォアが形成される。
12種類の異なる生物学的アッセイ（例：核受容体およびストレス応答経路）における毒性を同時に予測するマルチタスク学習を適用した。
バックプロパゲーションと確率的勾配降下法を用いてエンドツーエンドでモデルをトレーニングし、AUC（受受曲線下積分）を最適化した。
過学習を防ぎ、多様な化学構造にわたる一般化性能を向上させるためにドロップアウトとバッチ正規化を活用した。
複数の毒性予測タスク間で表現を共有することで、転移学習の原則を活用し、データが少ないターゲットでの性能を向上させた。

実験結果

リサーチクエスチョン

RQ1深層ニューラルネットワークは、専門家が設計した記述子を必要とせず、生の化学フォルダープリントから生物学的に意味のある特徴（例：トキシコフォア）を自動で学習できるか？
RQ2深層学習は、多様な生物学的経路をカバーする毒性予測において、従来の機械学習手法を上回る性能を示すか？
RQ3マルチタスク学習は、トレーニングデータが限られた毒性アッセイの予測性能を向上させられるか？
RQ4深層ネットワークの学習済み表現は、既知のトキシコフォアや新しい構造モチーフを示しているか？
RQ51つの深層学習モデルが、同時に複数の毒性予測チャレンジにおいて最先端の性能を達成できるか？

主な発見

深層学習モデルは、Tox21 Data Challengeの15のサブチャレンジすべてで平均AUCが最高となり、グランドチャンレンジを制した。
核受容体パネルおよびストレス応答パネルの両方で1位を獲得し、各パネルで最高の平均AUCを記録した。
いかなる個別のサブチャレンジにおいても5位以内に下がることはなく、一貫性があり、強固な性能を示した。
ネットワークの高層層で学習された表現は、芳香族環や電子受容体といった既知のトキシコフォアに対応しており、特徴の生物学的関連性が裏付けられた。
毒性予測に特化して設計された他の手法をも凌駆し、エンドツーエンドの深層学習が手作業によるアプローチを上回ることを証明した。
結果から、深層学習がデータから複雑で階層的な化学的特徴を発見できることを確認し、新規トキシコフォアの同定の可能性を示唆した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。