[論文レビュー] Drug-Drug Adverse Effect Prediction with Graph Co-Attention
この論文は、薬物間副作用を予測するために薬物表現を共同学習するグラフニューラルネットワーク MHCADDI を導入します。薬物内部メッセージパッシングと薬物間コアテンションを用いて、大規模な DDI データセットで、薬物構造のみを用いて最先端の AUROC を達成します。
Complex or co-existing diseases are commonly treated using drug combinations, which can lead to higher risk of adverse side effects. The detection of polypharmacy side effects is usually done in Phase IV clinical trials, but there are still plenty which remain undiscovered when the drugs are put on the market. Such accidents have been affecting an increasing proportion of the population (15% in the US now) and it is thus of high interest to be able to predict the potential side effects as early as possible. Systematic combinatorial screening of possible drug-drug interactions (DDI) is challenging and expensive. However, the recent significant increases in data availability from pharmaceutical research and development efforts offer a novel paradigm for recovering relevant insights for DDI prediction. Accordingly, several recent approaches focus on curating massive DDI datasets (with millions of examples) and training machine learning models on them. Here we propose a neural network architecture able to set state-of-the-art results on this task---using the type of the side-effect and the molecular structure of the drugs alone---by leveraging a co-attentional mechanism. In particular, we show the importance of integrating joint information from the drug pairs early on when learning each drug's representation.
研究の動機と目的
- 臨床的・経済的負担を減らすための多剤併用副作用の早期予測を動機づける。
- 分子グラフから共同の薬物表現を学習するニューラルアーキテクチャを開発する。
- 薬物構造のみを用いてクロス薬間コアテンションが予測を改善することを示す。
- 大規模な DDI データセットで評価し、既存のベースラインと比較する。
- 共同学習とアテンション機構の重要性を強調するアブレーションを実施する。
提案手法
- 各薬物を原子をノード、結合をエッジとする分子グラフとして表現する。
- 各薬物に対して T=3 のメッセージパッシングブロックを適用して内部薬物表現を学習する。
- 2 つの薬物間でコアテンションを組み込み、外部メッセージを計算し結合表現を形成する。
- マルチヘッドアテンション(K=8)を用いて薬物間情報を集約し原子特徴を更新する。
- 原子特徴を合計して薬物レベルのベクトルを得て副作用発生確率をスコアする。
- バイナリ分類のマージンベースのランキング損失または多ラベル分類のバイナリクロスエントロピーで訓練する。
実験結果
リサーチクエスチョン
- RQ1薬物の共同表現学習をクロス薬間コアテンションで行い、薬物構造のみを用いて DDI の副作用予測を改善できるか?
- RQ2薬物内部のメッセージパッシングを薬物間のアテンションと統合することで、複数の副作用に対する予測性能はどう変化するか?
- RQ3マルチヘッドコアテンションと早期のクロスモーダル情報は、単一モダリティや遅延フュージョンのベースラインより測定可能な改善をもたらすか?
- RQ4提案モデルは AUROC で大規模な DDI データセットに対して既存のベースラインとどう比較されるか?
主な発見
| Model | AUROC |
|---|---|
| Drug-Fingerprints (Jin et al. 2017) | 0.744 |
| RESCAL (Nickel et al. 2011) | 0.693 |
| DEDICOM (Papalexakis et al. 2017) | 0.705 |
| DeepWalk (Perozzi et al. 2014) | 0.761 |
| Concatenated features (Zitnik et al. 2018) | 0.793 |
| Decagon (Zitnik et al. 2018) | 0.872 |
| MHCADDI (ours) | 0.882 |
| MHCADDI-ML (ours) | 0.819 |
- MHCADDI は AUROC で Decagon や Drug-Fingerprints などの強力なベースラインを上回る(主なバイナリ設定での Decagon の 0.872 に対して 0.882)。
- アブレーションは joint learning と早期の薬物間情報(co-attention)が、後で薬物をフュージョンするアーキテクチャや内部メッセージパッシングのみを用いるアーキテクチャより性能を有意に向上させることを示す。
- マルチラベル版(MHCADDI-ML)は依然として競争力があるが、AUROC では単一ラベルの MHCADDI より若干劣る。
- t-SNE 分析は副作用ごとに薬物–薬物埋め込みの明確なクラスタリングを示し、意味のある共同表現を示唆する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。