QUICK REVIEW

[논문 리뷰] IGCV$2$: Interleaved Structured Sparse Convolutional Neural Networks

Guotian Xie, Jingdong Wang|arXiv (Cornell University)|2018. 04. 17.

Machine Learning and ELM참고 문헌 2인용 수 27

한 줄 요약

이 논문은 효율적인 컨volution 신경망을 위한 새로운 빌딩 블록인 IGCV$^2$를 제안한다. 이는 다중 구조적 희소 커널을 조합함으로써 상호 배치 그룹 컨볼루션을 일반화한다. 상호 보완성 및 균형 조건을 강제 적용함으로써 IGCV$^2$는 모델 크기, 계산 비용, 정확도 사이의 우수한 트레이드오프를 달성하며, FLOPs와 파라미터 수를 줄이면서도 높은 정확도를 유지하면서 ImageNet에서 Xception 및 MobileNet 변종을 능가한다.

ABSTRACT

In this paper, we study the problem of designing efficient convolutional neural network architectures with the interest in eliminating the redundancy in convolution kernels. In addition to structured sparse kernels, low-rank kernels and the product of low-rank kernels, the product of structured sparse kernels, which is a framework for interpreting the recently-developed interleaved group convolutions (IGC) and its variants (e.g., Xception), has been attracting increasing interests. Motivated by the observation that the convolutions contained in a group convolution in IGC can be further decomposed in the same manner, we present a modularized building block, {IGCV$2$:} interleaved structured sparse convolutions. It generalizes interleaved group convolutions, which is composed of two structured sparse kernels, to the product of more structured sparse kernels, further eliminating the redundancy. We present the complementary condition and the balance condition to guide the design of structured sparse kernels, obtaining a balance among three aspects: model size, computation complexity and classification accuracy. Experimental results demonstrate the advantage on the balance among these three aspects compared to interleaved group convolutions and Xception, and competitive performance compared to other state-of-the-art architecture design methods.

연구 동기 및 목표

효율적인 딥 러닝 모델을 위한 컨볼루션 커널 파라미터의 부재를 줄이기 위해.
Xception과 IGC를 일반화하기 위해 두 개 이상의 구조적 희소 커널을 조합함으로써 상호 배치 그룹 컨볼루션(IGC)을 일반화하기 위해.
밀도 있고 효과적인 커널을 희소 구성요소에서 유도하기 위한 설계 원칙—보완성 및 균형 조건—을 수립하기 위해.
경량 CNN 아키텍처에서 모델 크기, FLOPs, 분류 정확도 사이의 균형 잡힌 트레이드오프를 달성하기 위해.
ImageNet과 같은 대규모 이미지 분류 벤치마크에서 뛰어난 효율성과 성능을 입증하기 위해.

제안 방법

IGCV$^2$는 각각 블록 대각 희소성을 지닌 그룹 컨볼루션에 대응하는 다수의 구조적 희소 커널의 곱으로 밀도 있는 커널을 구성한다.
모든 출력 채널이 정확히 한 경로를 통해 모든 입력 채널에 연결되도록 보장하는 보완 조건을 도입하여 커널의 밀도를 유지한다.
모델 크기, FLOPs, 정확도 사이의 트레이드오프를 제어하기 위해 그룹 수와 희소성 패턴을 조정함으로써 균형 조건을 정의한다.
경로 다양성과 커널 조합을 가능하게 하기 위해 그룹 컨볼루션 간에 순열 행렬을 사용한다.
MobileNet이나 Xception와 유사하게, 블록(예: IGCV$^2$-1.0, IGCV$^3$)으로 모odular화하여 전체 네트워크에 스택할 수 있다.
선형 및 비선형 블록을 모두 지원하며, 더 깊은 블록에서는 스케일 연결과 채널 확장 기법을 적용한다.

실험 결과

연구 질문

RQ1두 개 이상의 구조적 희소 커널의 곱이 Xception 및 IGC와 같은 기존 방법을 초월해 더 이상의 중복을 줄일 수 있는가?
RQ2보완성 및 균형 조건을 수학적으로 정의하여 효과적인 커널 조합과 성능을 보장할 수 있는가?
RQ3제안된 IGCV$^2$ 블록이 ImageNet에서 최신 경량 CNN보다 더 나은 효율-정확도 트레이드오프를 달성하는가?
RQ4모듈러한 IGCV$^2$ 블록을 복합 블록 아키텍처와 효과적으로 조합하여 성능을 추가로 향상시킬 수 있는가?
RQ5Width multiplier와 아키텍처 깊이에 따라 IGCV$^2$의 성능이 MobileNet 및 Xception와 비교해 어떻게 스케일링되는가?

주요 결과

너비 배수 1.0을 가진 IGCV$^3$는 단지 350만 개의 파라미터와 32000만 FLOPs로 ImageNet에서 72.2%의 Top-1 정확도를 달성하며, 유사한 FLOP 및 파라미터 예산에서 MobileNetV2-1.0(71.0% 정확도)을 능가한다.
IGCV$^3$-0.7은 200만 개의 파라미터와 17000만 FLOPs로 68.46%의 Top-1 정확도를 기록하며, 더 작은 모델 크기임에도 불구하고 MobileNetV2-0.7(66.57%)를 능가한다.
유연한 그룹 구성이 가능한 느슨한 보완 조건을 가진 IGCV$^2$ 블록은 높은 성능을 유지하면서도 효율적인 하드웨어 구현을 가능하게 한다.
제안된 보완성 및 균형 조건는 구조적 희소 커널의 설계를 효과적으로 이끌며, 모델 크기나 FLOPs를 부당하게 증가시키지 않으면서도 밀도 있는 출력 커널을 보장한다.
IGCV$^2$-1.0은 MobileNetV1보다 더 작은 모델 크기로 ImageNet에서 경쟁 가능한 성능을 달성하여 그 효율성을 입증한다.
IGCV$^2$는 Xception과 IGC를 일반화하여 커널 조합에 두 개 이상의 구조적 희소 구성요소를 허용함으로써 더 이상의 중복 감소를 이끌어낸다.

더 나은 연구,지금 바로 시작하세요

연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.

카드 등록 없음 · 무료 플랜 제공

이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.