QUICK REVIEW

[논문 리뷰] Learning Graph Models for Template-Free Retrosynthesis.

Vignesh Ram Somnath, Charlotte Bunne|arXiv (Cornell University)|2020. 06. 12.

Machine Learning in Materials Science참고 문헌 18인용 수 27

한 줄 요약

이 논문은 목표 분자를 사전 단계로 변환하기 위해 그래프 편집을 학습하여 분자 전환을 예측하는 그래프 기반 역합성 모델을 제안한다. 이 모델은 전체 분자 생성 없이 사전 단계를 완성된 전구체로 확장한다. USPTO-50k에서 11.7%의 절대적 향상과 희귀 반응에서 4%의 향상을 기록하여 일반화 능력과 화학 전략 일치도를 향상시킨다.

ABSTRACT

Retrosynthesis prediction is a fundamental problem in organic synthesis, where the task is to identify precursor molecules that can be used to synthesize a target molecule. Despite recent advancements in neural retrosynthesis algorithms, they are unable to fully recapitulate the strategies employed by chemists and do not generalize well to infrequent reaction types. In this paper, we propose a graph-based approach that capitalizes on the idea that the graph topology of precursor molecules is largely unaltered during the reaction. The model first predicts the set of graph edits transforming the target into incomplete molecules called synthons. Next, the model learns to expand synthons into complete molecules by attaching relevant leaving groups. Since the model operates at the level of molecular fragments, it avoids full generation, greatly simplifying the underlying architecture and improving its ability to generalize. The model yields $11.7\%$ absolute improvement over state-of-the-art approaches on the USPTO-50k dataset, and a $4\%$ absolute improvement on a rare reaction subset of the same dataset.

연구 동기 및 목표

희귀 반응 유형으로의 일반화 능력이 제한된 신경망 기반 역합성 모델의 문제를 해결하기 위해.
분자 구조 변화를 모델링하여 화학자들이 설계한 역합성 전략과의 일치도를 향상시키기 위해.
전체 분자 생성이 아닌 분자 조각 수준에서 작동하여 아키텍처를 단순화하고 일반화 능력을 향상시키기 위해.
역합성 전환을 분자 구조의 그래프 편집 연산으로 모델링하기 위해.
관련 이탈기들을 사용하여 사전 단계를 유효한 완전한 전구체로 효과적으로 확장할 수 있도록 하기 위해.

제안 방법

모델은 목표 분자를 사전 단계로 불완전한 전구체 조각인 사전 단계로 변환하는 그래프 편집 연산의 시퀀스를 예측한다.
반응 중 분자 그래프 구조의 안정성을 활용하여 국소적 구조 변화에 집중한다.
학습된 규칙을 통해 적절한 이탈기를 부착하여 사전 단계를 완전한 분자로 확장한다.
전체 분자를 생성하는 것 없이 분자 조각 수준에서 작동한다.
분자 구조를 인코딩하고 편집 연산을 예측하기 위해 그래프 신경망을 사용한다.
모델은 역합성 전환 데이터를 엔드 투 엔드로 훈련하여 구조적 편집을 통한 반응의 역순 학습을 수행한다.

실험 결과

연구 질문

RQ1국소적 분자 편집을 학습하는 그래프 기반 모델이 기존의 신경망 기반 역합성 모델을 초월할 수 있는가?
RQ2전체 분자 대신 사전 단계를 다루는 것이 희귀 반응 유형으로의 일반화 능력을 향상시키는가?
RQ3분자 그래프 구조의 보존이 역합성 전략의 정확도에 얼마나 기여하는가?
RQ4이탈기 부착을 통해 사전 단계를 유효한 전구체로 효과적으로 확장할 수 있는가?
RQ5최신 기술 대비 모델의 성능은 분포 외 반응에서 어떻게 나타나는가?

주요 결과

모델은 USPTO-50k 데이터셋에서 최신 기술 대비 상위 1위 정확도에서 11.7%의 절대적 향상을 기록한다.
USPTO-50k 벤치마크 내 희귀 반응 서브셋에서 4%의 절대적 향상을 보였다.
편집 기반의 조각 수준에서의 작동 방식 덕분에 드문 반응 유형으로의 일반화 능력이 향상된다.
전체 분자 생성을 피했기 때문에 아키텍처가 단순화되었지만 높은 성능를 유지한다.
구조 보존 그래프 편집을 통해 화학적으로 의미 있는 역합성 전략을 더 잘 포착한다.
특히 복잡하거나 희귀한 반응 패턴에서 성능 향상이 두드러진다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.