QUICK REVIEW

[논문 리뷰] Gradient 𝓁 1 Regularization for Quantization Robustness.

Milad Alizadeh, Arash Behboodi|arXiv (Cornell University)|2020. 01. 01.

Advanced Neural Network Applications인용 수 3

한 줄 요약

이 논문은 다양한 비트 폭에서 후기훈련 양자화에 대한 신경망의 강건성을 향상시키기 위해 그래디언트 기반 ℓ₁ 정규화 기법을 제안한다. 양자화를 ℓ∞-유계 변형으로 모델링함으로써, 훈련 중에 그래디언트의 ℓ₁-노름을 정규화하여, 재훈련이나 훈련 데이터 접근 없이도 다양한 정밀도 수준으로 즉시 양자화할 수 있는 단일 모델을 가능하게 한다.

ABSTRACT

We analyze the effect of quantizing weights and activations of neural networks their loss and derive a simple regularization scheme that improves robustness against post-training quantization. By training quantization-ready networks, our approach enables storing a single set of weights that can be quantized on-demand to different bit-widths as energy and memory requirements of the application change. Unlike quantization-aware training using the straight-through estimator that only targets a specific bit-width and requires access to training data and pipeline, our regularization-based method paves the way for on the fly'' post-training quantization to various bit-widths. We show that by modeling quantization as a $\ell_\infty$-bounded perturbation, the first-order term in the loss expansion can be regularized using the $\ell_1$-norm of gradients. We experimentally validate the effectiveness of our regularization scheme different architectures CIFAR-10 and ImageNet datasets.

연구 동기 및 목표

다양한 비트 폭으로 후기훈련 양자화 후 모델 정확도를 유지하는 문제를 해결한다.
각 목표 비트 폭마다 재훈련이 필요하고 훈련 데이터 접근이 필요한 양자화 인식 훈련의 한계를 극복한다.
즉각적인 다양한 정밀도 수준으로의 양자화를 가능하게 하는 훈련 시 정규화 방법을 개발한다.
추론 파이프라인 수정 없이도 양자화에 대한 강건성을 향상시킨다.

제안 방법

후기훈련 양자화를 네트워크 가중치와 활성화에 대한 ℓ∞-유계 변형으로 모델링한다.
양자화 변형 하에서 손실의 일阶 테일러 전개를 유도한다.
손실 전개에서 그래디언트 항을 양자화 오차의 주요 원인으로 식별한다.
입력과 가중치에 대한 그래디언트의 ℓ₁-노름을 정규화하여 양자화에 대한 민감도를 감소시킨다.
표준 역전파를 사용하여 표준 훈련 중에 정규화를 적용한다.
재튜닝 없이도 여러 비트 폭으로 즉시 양자화가 가능한 단일 모델을 훈련한다.

실험 결과

연구 질문

RQ1단일 신경망이 다양한 후기훈련 양자화 비트 폭에서 강건성을 유지할 수 있는가?
RQ2양자화를 ℓ∞-유계 변형으로 모델링함으로써, 양자화 강건성 정규화 설계에 어떤 통찰을 제공하는가?
RQ3표준 훈련 대비 그래디언트의 ℓ₁ 정규화가 다양한 양자화 수준으로의 일반화를 향상시키는가?
RQ4제안된 방법은 훈련 데이터 접근이나 재훈련 없이도 다양한 비트 폭에서 경쟁 가능한 정확도를 달성할 수 있는가?

주요 결과

제안된 ℓ₁ 그래디언트 정규화는 다양한 비트 폭에서 후기훈련 양자화 이후 테스트 정확도를 크게 향상시킨다.
제안된 방법으로 훈련된 모델은 재훈련 없이도 4비트, 6비트, 8비트 정밀도로 양자화된 상태에서도 높은 정확도를 유지한다.
즉각적인 다양한 비트 폭으로의 양자화가 요구되는 환경에서, 표준 훈련 및 양자화 인식 훈련보다 성능이 뛰어나다.
이론적 및 실증적 분석을 통해 정규화가 ℓ∞-유계 양자화 변형에 대한 손실 민감도를 효과적으로 감소시킴을 보였다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.

[논문 리뷰] Gradient &#120001; 1 Regularization for Quantization Robustness.