QUICK REVIEW

[논문 리뷰] Robust Optimal Transport with Applications in Generative Modeling and Domain Adaptation

Yogesh Balaji, Rama Chellappa|arXiv (Cornell University)|2020. 10. 12.

Infrastructure Maintenance and Monitoring인용 수 12

한 줄 요약

이 논문은 외곽값에 대한 민감도를 줄이기 위해 경계 조건을 완화함으로써 계산적으로 효율적인 강건한 최적 운반(OT)의 이중 형태를 제안한다. 이는 딥러닝에서 안정적인 훈련을 가능하게 하며, 노이즈가 있는 데이터셋에서 최신 기준 성능을 달성하고, 생성 난이도를 반영하는 표본별 가중치를 학습함으로써 도메인 적응 정확도를 향상시킨다.

ABSTRACT

Optimal Transport (OT) distances such as Wasserstein have been used in several areas such as GANs and domain adaptation. OT, however, is very sensitive to outliers (samples with large noise) in the data since in its objective function, every sample, including outliers, is weighed similarly due to the marginal constraints. To remedy this issue, robust formulations of OT with unbalanced marginal constraints have previously been proposed. However, employing these methods in deep learning problems such as GANs and domain adaptation is challenging due to the instability of their dual optimization solvers. In this paper, we resolve these issues by deriving a computationally-efficient dual form of the robust OT optimization that is amenable to modern deep learning applications. We demonstrate the effectiveness of our formulation in two applications of GANs and domain adaptation. Our approach can train state-of-the-art GAN models on noisy datasets corrupted with outlier distributions. In particular, our optimization computes weights for training samples reflecting how difficult it is for those samples to be generated in the model. In domain adaptation, our robust OT formulation leads to improved accuracy compared to the standard adversarial adaptation methods. Our code is available at this https URL.

연구 동기 및 목표

데이터 분포에서 노이즈 또는 외곽값이 있는 경우 기존 최적 운반의 민감도 문제를 해결하기 위해.
딥러닝 응용 분야에서 안정적이고 확장 가능한 이중 최적화 공식을 개발하기 위해.
외곽 분포로 오염된 데이터셋에서 효과적인 생성 모델링을 가능하게 하기 위해.
강력한 소스-타겟 도메인 정렬을 학습함으로써 도메인 적응 성능을 향상시키기 위해.
현대 딥러닝 훈련 파ip라인과 호환되는 실용적이고 미분 가능한 OT 프레임워크를 제공하기 위해.

제안 방법

외곽값의 영향을 줄이기 위해 비균형 경계 조건을 가진 강력한 OT의 이중 형태를 유도한다.
딥 네트워크의 역전파에 적합한 미분 가능하고 안정적인 최적화 방법을 제안한다.
생성 난이도를 반영하기 위해 훈련 샘플에 대해 적응형 가중치를 할당한다.
외곽값을 훈련 중에 가중치를 낮추는 방식으로 완화된 경계 조건을 적용한다.
강력한 OT 손실을 GAN 및 도메인 적응 프레임워크에 통합하여 미분 가능한 목표 함수로 사용한다.
이중 최적화에서 발생하는 불안정성 문제를 피하기 위한 계산적으로 효율적인 해법을 사용한다.

실험 결과

연구 질문

RQ1비균형 경계 조건을 가진 강력한 최적 운반을 딥러닝에 안정적이고 미분 가능한 이중 형태로 공식화할 수 있는가?
RQ2제안된 강력한 OT 공식은 외곽 분포가 있는 데이터셋에서 GAN 훈련에 어떻게 기여하는가?
RQ3기존의 표준 대비성 적응 기반 방법에 비해 이 방법은 도메인 적응 정확도를 어느 정도 향상시키는가?
RQ4이 방법은 생성 모델링에서 생성 난이도를 반영하는 의미 있는 표본 가중치를 학습할 수 있는가?
RQ5강력한 OT 손실은 딥 생성 모델의 훈련을 더 안정적이고 신뢰할 수 있게 만드는가?

주요 결과

제안된 강력한 OT 공식은 외곽 분포로 오염된 데이터셋에서 GAN 훈련에서 최신 기준 성능을 달성한다.
이 방법은 어려운 또는 노이즈가 있는 샘플을 효과적으로 식별하고 훈련 중에 가중치를 낮추는 표본별 가중치를 학습한다.
도메인 적응에서, 강력한 OT 접근법은 기존의 대비성 적응 기반 방법보다 정확도를 향상시킨다.
이중 최적화 방법은 안정적이고 확장 가능하여 딥러닝 프레임워크에서 엔드 투 엔드 훈련을 가능하게 한다.
데이터 사전 정제 없이도 노이즈에 대한 강건성을 향상시킨다.
코드는 공개되어 있어 재현성과 기존 딥러닝 파이프라인에의 통합을 지원한다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.