QUICK REVIEW

[논문 리뷰] How Does Disagreement Benefit Co-teaching?

Xingrui Yu, Bo Han|arXiv (Cornell University)|2019. 01. 14.

Machine Learning and Data Classification인용 수 23

한 줄 요약

Co-teaching+는 두 네트워크 간의 이견이 있는 경우에만 상대 네트워크의 소손실 샘플을 사용하여 각 네트워크를 업데이트하는 새로운 공교수 프레임워크를 제안한다. 이는 조기 수렴을 방지하고 기준 데이터셋에서 최신 기술보다 뛰어난 성능을 발휘한다.

ABSTRACT

Learning with noisy labels is one of the hottest problems in weakly-supervised learning. Based on memorization effects of deep neural networks, training on small-loss instances becomes very promising for handling noisy labels. This fosters the state-of-the-art approach that cross-trains two deep neural networks using the small-loss trick. However, with the increase of epochs, two networks converge to a consensus and Co-teaching reduces to the self-training MentorNet. To tackle this issue, we propose a robust learning paradigm called Co-teaching+, which bridges the Update by Disagreement strategy with the original Co-teaching. First, two networks feed forward and predict all data, but keep prediction disagreement data only. Then, among such disagreement data, each network selects its small-loss data, but back propagates the small-loss data from its peer network and updates its own parameters. Empirical results on benchmark datasets demonstrate that Co-teaching+ is much superior to many state-of-the-art methods in the robustness of trained models.

연구 동기 및 목표

공교수의 한계, 즉 네트워크가 공감대에 도달하여 자기학습으로 악화되는 문제를 해결하기 위해.
학습 중 두 학생 네트워크 간의 다양성을 유지하여 노이즈가 있는 레이블 환경에서의 일반화 능력을 향상시키기 위해.
청결한 레이블 사전 지식에 의존하지 않고 네트워크 간 이견을 활용하여 강건한 학습을 이끌어내는 학습 프레임워크를 개발하기 위해.
소손실 학습 전략의 효과를 높이기 위해 업데이트를 오직 이견이 있는 샘플에만 집중함으로써 노이즈 레이블의 기억을 방지하기 위해.

제안 방법

프레임워크는 두 개의 딥 네럴 네트워크를 공교수 방식으로 훈련하지만, 두 네트워크가 예측에서 이견을 보이는 경우에만 각 네트워크를 업데이트한다.
이견 샘플 중에서 각 네트워크는 자신만의 소손실 예측을 학습 타겟으로 선택한다.
핵심적으로, 각 네트워크는 동일한 이견 샘플에서 상대 네트워크의 예측에 대한 손실을 역전파하여 교차 업데이트를 가능하게 한다.
이 상대 손실 역전파 메커니즘은 두 네트워크가 모두 노이즈가 있을지라도 파트너의 더 신뢰할 수 있는 예측에서 배울 수 있도록 보장한다.
공감대에 도달한 예측에 대한 업데이트를 피하므로, 공통된 잘못된 예측로의 수렴을 방지한다.
훈련 과정에서 네트워크 간의 이견을 동적으로 유지함으로써 다양성을 유지하고 노이즈 레이블의 기억을 줄인다.

실험 결과

연구 질문

RQ1두 네트워크 간의 예측 이견을 유지하는 것이 공교수에서 노이즈 레이블에 대한 강건성에 어떤 영향을 미치는가?
RQ2상대 네트워크의 소손실 업데이트는 표준 공교수 및 자기학습 기반선을 초월하여 일반화 능력을 향상시킬 수 있는가?
RQ3업데이트를 오직 이견이 있는 샘플에만 집중하는 것이 조기 수렴을 방지하고 모델의 강건성을 향상시키는가?
RQ4표준 기준 데이터셋에서 높은 노이즈 비율을 처리할 때 Co-teaching+는 최신 기술 방법과 어떻게 비교되는가?

주요 결과

Co-teaching+는 표준 공교수 및 자기학습 기반선보다 노이즈 레이블에 대해 훨씬 더 뛰어난 강건성을 확보한다.
다양한 노이즈 설정 하에서 기준 데이터셋에서 여러 최신 기술 방법을 능가한다.
업데이트를 이견 샘플로 제한함으로써 Co-teaching+는 시간이 지남에 따라 악화되는 공감대 수렴 문제를 방지한다.
상대 네트워크의 소손실 타겟을 사용함으로써 학습 효율성과 일반화 능력이 향상되며, 이는 두 네트워크가 모두 노이즈 데이터로 훈련되더라도 유효하다.
실험 결과는 이견 기반 업데이트 메커니즘이 노이즈 레이블의 기억을 효과적으로 줄인다는 것을 확인한다.
다양한 노이즈 비율과 데이터셋 유형에서 성능 향상이 유지되어 강력한 일반화 능력을 보여준다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.