QUICK REVIEW

[논문 리뷰] Dr.VAE: Drug Response Variational Autoencoder

Ladislav Rampášek, Daniel Hidru|arXiv (Cornell University)|2017. 06. 26.

Machine Learning in Materials Science참고 문헌 7인용 수 23

한 줄 요약

Dr.VAE는 사전 및 사후 치료 유전자 발현 데이터를 사용하여 약물 유도 유전자 발현 변화 및 치료 반응 결과를 함께 모델링하는 준감독형 변동 자동부호화기 프레임워크를 제안한다. 생물학적 교란 효과와 전체적인 약물 반응을 모두 코딩하는 분리된 잠재 표현을 학습함으로써, 최신 기준 대비 AUROC에서 3–11% 향상되고 AUPR에서 2–30% 향상되는 예측 정확도 향상을 달성한다.

ABSTRACT

We present two deep generative models based on Variational Autoencoders to improve the accuracy of drug response prediction. Our models, Perturbation Variational Autoencoder and its semi-supervised extension, Drug Response Variational Autoencoder (Dr.VAE), learn latent representation of the underlying gene states before and after drug application that depend on: (i) drug-induced biological change of each gene and (ii) overall treatment response outcome. Our VAE-based models outperform the current published benchmarks in the field by anywhere from 3 to 11% AUROC and 2 to 30% AUPR. In addition, we found that better reconstruction accuracy does not necessarily lead to improvement in classification accuracy and that jointly trained models perform better than models that minimize reconstruction error independently.

연구 동기 및 목표

희소하고 고차원적인 유전자 발현 데이터를 사용하여 암 세포선에서의 약물 반응 예측을 향상시키기 위해.
사전 및 사후 치료 유전자 발현 데이터(교란 쌍)와 약물 반응 결과를 통합된 딥 생성 모델에 통합하기 위해.
레이블이 부여된 반응 데이터와 레이블이 없는 교란 데이터를 모두 활용하여 예측 성능을 향상시키는 준감독형 프레임워크를 개발하기 위해.
교란과 반응의 공동 모델링이 별도의 재구성 및 분류 최적화보다 더 나은 분류 성능을 내는지 조사하기 위해.

제안 방법

Dr.VAE는 사전 및 사후 치료 유전자 발현을 공유 잠재 공간으로 매핑하기 위해 공유 인코더 및 디코더를 사용하는 딥 변동 자동부호화기이다.
모델은 사전 치료 상태에서 사후 치료 상태로의 전환으로서 약물 유도 교란 효과를 모델링하기 위해 잠재 공간 내에서 확률적 선형 함수를 통합한다.
효율적인 사후 근사 및 향상된 추론을 위해 확률적 경량 최적화 기반 베이즈(SGVB)와 역자기회귀 흐름(IAF)을 사용한다.
유전자 발현 재구성과 약물 반응 결과 예측의 균형을 이루는 공동 목적 함수를 사용하여 프레임워크를 훈련한다.
준감독형 확장은 레이블이 없는 사전 치료 데이터를 활용하여 잠재 표현 학습을 향상시킬 수 있도록 한다.
19种 약물에 대해 가용한 교란 및 반응 데이터를 바탕으로 10겹 교차검증을 사용하여 모델을 평가한다.

실험 결과

연구 질문

RQ1딥 생성 모델이 유전자 발현 교란과 약물 반응 결과의 잠재 표현을 함께 학습하여 예측 정확도를 향상시킬 수 있는가?
RQ2교란 모델링과 반응 분류를 함께 훈련하는 것이 별도로 훈련하는 것보다 성능이 뛰어나게 되는가?
RQ3유전자 발현의 높은 재구성 정확도가 약물 반응 분류 정확도 향상에 충분한가?
RQ4비지도 교란 데이터가 준감독 약물 반응 예측 모델의 성능 향상에 기여할 수 있는가?

주요 결과

Dr.VAE는 19종의 약물에 걸쳐 기준 대비 AUROC에서 3–11% 향상되고 AUPR에서 2–30% 향상되어 최신 기준 수준의 성능을 입증한다.
비지도 구성요소인 PertVAE는 8종의 약물 중 세포선 데이터가 충분한 5종에서 통계적으로 유의미한 상관관계(p ≤ 0.001)를 보이며 사후 치료 유전자 발현을 성공적으로 예측한다.
재구성 성능만으로는 분류 정확도 향상이 보장되지 않음을 시사하며, 이는 잠재 공간이 압축 기능 외에도 예측 기능을 수행한다는 것을 의미한다.
교란과 반응 모델링의 공동 훈련은 재구성과 분류를 별도로 훈련하는 것보다 더 나은 분류 성능을 낳는다.
100개의 확률적 잠재 변수를 가진 모델이 표현력과 일반화 사이의 최적의 트레이드오프를 달성하여, 작은 잠재 공간에서의 PCA보다 뛰어난 성능을 보였다.
잠재 공간은 재구성 외에도 생물학적으로 관련된 정보를 캡처하고 있으며, 이는 제한된 데이터와 높은 노이즈 조건에서도 분류 성능 향상으로 증명된다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.