[論文レビュー] Machine-Learning Driven Drug Repurposing for COVID-19
本研究では、ウイルス性タンパク質配列と既知の抗ウイルス薬を用いて訓練された人工ニューラルネットワークを活用し、既存の薬剤をCOVID-19に再利用するための機械学習的手法を提案している。モデルはSARS-CoV-2に対して効果的で安全な広域作用抗ウイルス薬を予測し、12の上位候補薬を特定した。そのうち6つ(リトナビル、リトナビル、リバビリン、シクロスポリン、ラパマイシン、ニタゾキサンサイト)は、臨床的所見と一致している。
The integration of machine learning methods into bioinformatics provides particular benefits in identifying how therapeutics effective in one context might have utility in an unknown clinical context or against a novel pathology. We aim to discover the underlying associations between viral proteins and antiviral therapeutics that are effective against them by employing neural network models. Using the National Center for Biotechnology Information virus protein database and the DrugVirus database, which provides a comprehensive report of broad-spectrum antiviral agents (BSAAs) and viruses they inhibit, we trained ANN models with virus protein sequences as inputs and antiviral agents deemed safe-in-humans as outputs. Model training excluded SARS-CoV-2 proteins and included only Phases II, III, IV and Approved level drugs. Using sequences for SARS-CoV-2 (the coronavirus that causes COVID-19) as inputs to the trained models produces outputs of tentative safe-in-human antiviral candidates for treating COVID-19. Our results suggest multiple drug candidates, some of which complement recent findings from noteworthy clinical studies. Our in-silico approach to drug repurposing has promise in identifying new drug candidates and treatments for other viruses.
研究の動機と目的
- SARS-CoV-2に対する薬剤再利用を加速させるために、既存の抗ウイルス薬の有効性を機械学習で同定すること。
- COVID-19パンデミック期における迅速な治療薬発見の緊急性に対応し、既知の薬-ウイルス相互作用データを活用すること。
- ウイルスプロテオームの類似性に基づいて抗ウイルス候補薬を予測するスケーラブルなインシリコパイプラインの開発。
- 高い毒性または人間に対する安全性データが乏しい薬剤を除外することで、臨床的実現可能性の高い薬剤を優先すること。
提案手法
- ウイルス性タンパク質配列を入力とし、FDA承認済みまたは臨床的に安全な抗ウイルス薬を出力とする人工ニューラルネットワーク(ANN)モデルを訓練した。
- 83種のウイルスから得た280万件のウイルスアミノ酸配列をNCBIウイルスポータルから取得し、データバイアスを避けるためにHIVおよびインフルエンザ由来の株を除いた。
- 既知の広域作用抗ウイルス薬(BSAAs)とそのウイルスに対する阻害プロファイルをマッピングするためにDrugVirusデータベースを活用した。
- 配列とメタデータを統合し、第II〜IV相および承認済み薬に限定した後、種および配列長に基づいて重複を除外することでデータを前処理した。
- モデル入力用にアミノ酸配列を数値ベクトルに変換するためにワンホットエンコーディングを適用した。
- 非SARS-CoV-2ウイルスタンパク質でモデルを訓練し、SARS-CoV-2配列に対して予測を実施することで、薬剤再利用候補を同定した。
実験結果
リサーチクエスチョン
- RQ1他のウイルスとタンパク質の類似性に基づいて、既存の抗ウイルス薬の中でSARS-CoV-2に対して最も効果的である可能性があるのはどれか?
- RQ2既知の薬-ウイルス相互作用に基づいて訓練された機械学習モデルは、新たな抗ウイルス薬の再利用機会を予測できるか?
- RQ3モデルの予測結果は、SARS-CoV-2に関する最近の臨床的およびin vitroの所見とどのように一致するか?
- RQ4このインシリコ的手法は、他のウイルス病原体に対してもどの程度一般化可能か?
主な発見
- モデルはSARS-CoV-2に対する12の上位抗ウイルス候補薬を同定した。そのうち6つ(リトナビル、リトナビル、リバビリン、シクロスポリン、ラパマイシン、ニタゾキサンサイト)は、その後のin vitroまたは臨床試験結果によって裏付けられた。
- 本アプローチは、既に承認済みで安全性が確認された抗ウイルス薬を的確に予測でき、実世界の所見と整合していることを示した。
- 承認されていない人用薬剤はモデルから除外されたため、予測結果は臨床的関連性があり、さらなる調査に適した安全性を有していた。
- 二次実験において単純ヘルペスウイルス1型(HSV-1)に対して効果的な抗ウイルス薬の予測に成功したことから、一般化可能性が裏付けられた。
- 大規模なウイルスプロテオームデータを処理し、実行可能な薬剤再利用の仮説を生成するという点で、本パイプラインの効率性が示された。
- 予測結果は、既知の抗ウイルス作用メカニズムおよび臨床的証拠との整合性から、妥当性が裏付けられた。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。