Skip to main content
QUICK REVIEW

[논문 리뷰] Learning to Make Generalizable and Diverse Predictions for Retrosynthesis

Benson Chen, Tianxiao Shen|arXiv (Cornell University)|2019. 10. 21.
Machine Learning in Materials Science참고 문헌 26인용 수 52
한 줄 요약

이 논문은 두 가지 사전 학습 전략과 이산 혼합 모델을 통해 분자 Transformer를 확장하여 단일 단계 역합성 예측의 일반화와 다양성을 개선하고, USPTO-50k에서 상위-10 정확도를 더 높이며 더 다양한 출력 생성을 보인다.

ABSTRACT

We propose a new model for making generalizable and diverse retrosynthetic reaction predictions. Given a target compound, the task is to predict the likely chemical reactants to produce the target. This generative task can be framed as a sequence-to-sequence problem by using the SMILES representations of the molecules. Building on top of the popular Transformer architecture, we propose two novel pre-training methods that construct relevant auxiliary tasks (plausible reactions) for our problem. Furthermore, we incorporate a discrete latent variable model into the architecture to encourage the model to produce a diverse set of alternative predictions. On the 50k subset of reaction examples from the United States patent literature (USPTO-50k) benchmark dataset, our model greatly improves performance over the baseline, while also generating predictions that are more diverse.

연구 동기 및 목표

  • Rare reactions에서 템플릿 없는 역합성 모델의 일반화 격차를 해결한다.
  • 주어진 표적 분자에 대한 예측 반응 물질 세트의 다양성을 증가시킨다.
  • 역합성 모델을 초기화하기 위해 화학적으로 의미 있는 사전 학습 task를 활용한다.
  • 다양한 예측 모드를 생성하기 위한 이산 잠재 변수 혼합을 도입한다.
  • USPTO-50k 및 템플릿 분할에서 개선된 정확도와 다양성을 입증한다.

제안 방법

  • target SMILES를 반응물 SMILES로 매핑하는 Transformer 기반 seq2seq 모델을 사용한다.
  • 랜덤 결합 파쇄 및 템플릿 기반 분해의 두 가지 화학정보학 정렬 사전 학습 스킴을 도입한다.
  • 다양한 예측 모드를 생성하기 위해 반응에 대한 이산 잠재 변수 혼합을 도입한다.
  • 잠재 구성 요소의 전문화를 촉진하기 위해 온라인 hard-EM으로 학습한다.
  • USPTO-50k 및 템플릿 분할 데이터에서 top-10 정확도와 다양성 지표로 평가한다.

실험 결과

연구 질문

  • RQ1화학적으로 근거 있는 사전 학습이 역합성 트랜스포머의 일반화를 개선할 수 있는가?
  • RQ2,

주요 결과

  • 사전 학습(랜덤 또는 템플릿 기반)이 데이터 증강과 결합될 때 기준선 대비 정확도를 향상시킨다.
  • 잠재 클래스(K)가 많을수록 일반적으로 상위-10 정확도가 높아지나 상위-1 정확도에는 트레이드오프가 존재한다.
  • 혼합 모델은 예측 다양성을 증가시키며, 혼합 모델이 기본 모델보다 더 많은 고유한 반응 클래스를 예측한다.
  • 템플릿 기반 방법이 실패하는 템플릿 분할에서 혼합/사전 학습 접근법은 상당한 상위-10 정확도(기준선 26.6% vs 20.6%)를 달성한다.
  • 인간 평가에서 혼합 모델이 기본 모델보다 더 다양한 것으로 평가되는 경향이 있다(선호 판단 43 vs 21).
  • 희귀 반응 부분집합에서 혼합 및 사전 학습은 템플릿 기반 모델이 저조한 경우 일반화 이점을 제공한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.