Skip to main content
QUICK REVIEW

[논문 리뷰] Soft-to-Hard Vector Quantization for End-to-End Learning Compressible Representations

Eirikur Agustsson, Fabian Mentzer|arXiv (Cornell University)|2017. 04. 03.
Advanced Image Processing Techniques참고 문헌 37인용 수 262
한 줄 요약

본 논문은 엔드 투 엔드 학습으로 학습 가능한 특징 표현 및 모델을 학습하기 위한 소프트-투-하드 벡터 양자화 프레임워크를 도입하여, 이미지 및 DNN 압축에서 경쟁력 있는 결과를 달성한다.

ABSTRACT

We present a new approach to learn compressible representations in deep architectures with an end-to-end training strategy. Our method is based on a soft (continuous) relaxation of quantization and entropy, which we anneal to their discrete counterparts throughout training. We showcase this method for two challenging applications: Image compression and neural network compression. While these tasks have typically been approached with different methods, our soft-to-hard quantization approach gives results competitive with the state-of-the-art for both.

연구 동기 및 목표

  • 심층 네트워크 및 데이터 유형에 대해 압축 가능한 표현 학습에 대한 동기를 부여한다.
  • 모델 파라미터, 양자화 수준, 심볼 스트림의 엔트로피를 함께 최적화한다.
  • 네트워크의 특징과 전체 모델의 압축을 위한 통합 프레임워크를 제공한다.

제안 방법

  • 연속적인 양자화 및 엔트로피의 소프트(연속) 완화를 도입하고 부드러운 할당에서 하드 할당으로의 어닐링 스케줄을 적용한다.
  • 인코더 E를 학습된 코드북에서 가장 가까운 센터를 선택하는 것으로 모델링하고; 디코더 D는 심볼 인덱스에서 재구성한다.
  • differentiable한 소프트 히스토그램과 실제 엔트로피를 상한하는 소프트 엔트로피 손실을 통해 엔트로피를 추정한다.
  • 소프트 양자화를 하드 할당으로 어닐링하여 엔드-투-엔드 미분 가능 학습을 가능하게 한다.
  • 병목 통계의 포착을 개선하기 위해 스칼라가 아니라 벡터 양자화를 적용한다.
  • 압축 자동인코더를 통한 이미지 압축과 DNN 모델 압축( CIFAR-10의 ResNet )에 대한 엔드-투-엔드 학습을 입증한다.

실험 결과

연구 질문

  • RQ1soft-to-hard 벡터 양자화를 딥 네트워크에서 왜곡과 비트율의 합(D + βR)을 최소화하도록 엔드-투-엔드로 학습할 수 있는가?
  • RQ2양자화 수준을 가중치와 함께 공동으로 학습하는 것이 이미지 데이터와 모델 파라미터 모두의 압축 가능성을 향상시키는가?
  • RQ3학습된 압축 시나리오에서 벡터 양자화와 스칼라 양자화의 차이는 무엇인가?
  • RQ4강한 모수적 가정 없이 히스토그램 기반 엔트로피 추정이 경쟁력 있는 결과를 낳을 수 있는가?

주요 결과

방법정확도압축
원본 모델92.61.00
가지치기 + ft. + 인덱스 코딩 + H. 코딩 [12]92.64.52
가지치기 + ft. + k-평균 + ft. + I.C. + H.C. [11]92.618.25
가지치기 + ft. + Hessian-weighted k-means + ft. + I.C. + H.C.92.720.51
가지치기 + ft. + Uniform quantization + ft. + I.C. + H.C.92.722.17
가지치기 + ft. + Iterative ECSQ + ft. + I.C. + H.C.92.721.01
소프트-투-하드 어닐링 + ft. + H. 코딩 (ours)92.119.15
소프트-투-하드 어닐링 + ft. + A. 코딩 (ours)92.120.15
  • 이미지 압축과 DNN 모델 압축 모두에서 최첨단 방법과 경쟁력 있는 성능을 달성한다.
  • 소프트-투-하드 어닐링이 있는 벡터 양자화는 스칼라 양자화에 비해 비트율-왜곡(trade-off)을 개선한다.
  • 소프트 히스토그램에 기반한 엔트로피 손실은 압축 가능성에 대한 미분 가능한 가이드를 제공한다.
  • 32-층 ResNet으로 CIFAR-10에서 약 19–20× 압축을 달성하되 정확도 손실은 최소화된다.
  • 이미지 압축의 경우, 고압축 비율에서 SHA가 JPEG/JPEG 2000을 능가하고 여러 데이터셋에서 BPG와 경쟁력 있다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.