QUICK REVIEW

[논문 리뷰] ChannelNets: Compact and Efficient Convolutional Neural Networks via Channel-Wise Convolutions

Hongyang Gao, Zhengyang Wang|arXiv (Cornell University)|2018. 09. 05.

Advanced Neural Network Applications인용 수 32

한 줄 요약

ChannelNets는 밀도 있는 상호 특징 맵 연결을 희박하고 구조화된 연결로 대체함으로써 깊이 있는 CNN 모델을 압축하기 위해 채널별 컨벌루션을 도입한다. 그룹 채널별 컨벌루션, 깊이 지능형 분리 채널별 컨벌루션, 그리고 새로운 컨벌루션 분류 레이어를 활용함으로써 ChannelNets는 최신 기술 수준의 효율-정확도 트레이드오프를 달성하여 파라미터와 FLOPs를 줄이면서도 ImageNet에서 정확도를 유지하거나 향상시키며, 특히 완전 연결 분류 레이어를 압축한 최초의 모델이다.

ABSTRACT

Convolutional neural networks (CNNs) have shown great capability of solving various artificial intelligence tasks. However, the increasing model size has raised challenges in employing them in resource-limited applications. In this work, we propose to compress deep models by using channel-wise convolutions, which re- place dense connections among feature maps with sparse ones in CNNs. Based on this novel operation, we build light-weight CNNs known as ChannelNets. Channel- Nets use three instances of channel-wise convolutions; namely group channel-wise convolutions, depth-wise separable channel-wise convolutions, and the convolu- tional classification layer. Compared to prior CNNs designed for mobile devices, ChannelNets achieve a significant reduction in terms of the number of parameters and computational cost without loss in accuracy. Notably, our work represents the first attempt to compress the fully-connected classification layer, which usually accounts for about 25% of total parameters in compact CNNs. Experimental results on the ImageNet dataset demonstrate that ChannelNets achieve consistently better performance compared to prior methods.

연구 동기 및 목표

모바일 및 엣지 디바이스와 같은 자원 제한 환경에서 깊이 있는 CNN의 증가하는 모델 크기와 계산 비용을 해결하기 위해.
특히 컴팩트 모델에서 약 25%의 파라미터를 차지하는 완전 연결 분류 레이어를 대상으로, 정확도를 훼손하지 않으면서도 파라미터 수와 FLOPs를 줄이기 위해.
밀도 있는 특징 맵 간 연결 대신 새로운 희박하고 채널 중심의 연결 패턴을 사용하여, 새로운 경량 CNN 패밀리인 ChannelNets를 개발하기 위해.
특징 맵 간 연결의 희박성, 특히 최종 분류 레이어에서의 희박성이 구조화된 컨벌루션 연산을 통해 효과적으로 활용될 수 있는지 검증하기 위해.

제안 방법

밀도 있는 상호 특징 맵 간 연결을 희박하고 채널 전용 연결로 대체함으로써 파라미터 수와 FLOP 수를 줄이는 채널별 컨벌루션을 제안한다.
그룹 채널별 컨벌루션을 도입하여, 공유된 희박한 가중치를 채널 전역에 걸쳐 사용하는 정보 융합 레이어를 설계한다.
기존의 깊이 지능형 분리 컨벌루션에서 1×1 컨벌루션 대신 채널별 컨벌루션을 사용함으로써 깊이 지능형 분리 채널별 컨벌루션을 설계하여 계산량을 줄이고도 표현 능력을 유지한다.
완전 연결 레이어를 대체하기 위해 특징 맵에 대한 공간 컨벌루션을 사용하는 컨벌루션 분류 레이어를 개발함으로써, 각 클래스당 (m−n+1)개의 활성 특징만을 사용하는 파라미터 효율적인 희박한 예측을 가능하게 한다.
그룹 채널별 컨벌루션과 깊이 지능형 분리 채널별 컨벌루션을 초기 및 중간 블록에서 사용하고, 최종 레이어에서 컨벌루션 분류 레이어를 사용하는 통합 아키텍처인 ChannelNets를 설계한다.
사전 훈련된 모델의 미세조정 없이 표준 훈련 프rotocol를 사용하여 ChannelNets를 처음부터 훈련함으로써 종단 간 효율성과 컴팩트함을 보장한다.

실험 결과

연구 질문

RQ1밀도 있는 상호 특징 맵 간 연결을 희박하고 채널 중심의 연결로 대체함으로써, 정확도 손실 없이 모델 크기와 계산 비용을 크게 줄일 수 있는가?
RQ2일반적으로 컴팩트한 CNN에서 두 번째로 큰 파라미터 소스인 완전 연결 분류 레이어를 구조화된 컨벌루션 레이어로 압축하는 것이 실현 가능하고 효과적인가?
RQ3그룹 채널별 컨벌루션은 표준 그룹 컨벌루션 대비 정확도와 파라미터 효율성 측면에서 어떻게 비교되는가?
RQ4깊이 지능형 분리 채널별 컨벌루션은 표준 깊이 지능형 분리 컨벌루션 대비 정확도와 FLOP 효율성 측면에서 뛰어나게 성능을 내는가?
RQ5완전 연결 레이어 가중치의 내재된 희박성이 컨벌루션 분류 레이어 설계를 뒷받침하는 데 얼마나 기여하는가?

주요 결과

ChannelNet-v2는 약 230만 개의 파라미터를 사용하여 0.75x MobileNet과 유사한 수준의 파라미터를 유지하면서도 top-1 정확도에서 1.1% 높은 성능을 기록하여 깊이 지능형 분리 채널별 컨벌루션의 효과를 입증한다.
ChannelNet-v3는 약 110만 개의 파라미터를 사용하여 0.5x MobileNet과 유사한 수준의 파라미터를 유지하면서도 top-1 정확도에서 3% 높은 성능을 기록하여 뛰어난 압축 효율성과 정확도 유지 능력을 보여준다.
그룹 채널별 컨벌루션을 사용한 ChannelNet-v1은 이를 사용하지 않은 버전보다 top-1 정확도에서 0.8% 높은 성능을 내며, 단지 32개의 추가 파라미터로도 성능 향상을 이룬다. 이는 방법의 효율성과 효과성을 입증한다.
ChannelNet-v1의 완전 연결 분류 레이어의 가중치 행렬은 희박하게 분포되어 있음을 확인하여, 제안된 컨벌루션 분류 레이어의 설계 철학이 타당함을 검증한다.
ChannelNet-v1에 너비 배수를 적용할 경우 성능이 열악해지며, 이는 제안된 채널별 컨벌루션 구성 요소가 너비 스케일링보다 모델 압축에 더 효과적임을 시사한다.
제안된 컨벌루션 분류 레이어는 이전에 모델 압축에서 간과되었던 완전 연결 레이어를 성공적으로 압축하였다. 이에 따라 ChannelNets는 이를 처음으로 실현한 컴팩트한 CNN 패밀리가 되었다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.