[논문 리뷰] GhostNet: More Features from Cheap Operations
이 논문은 저가의 선형 연산으로 더 많은 특징 맵을 생성하는 Ghost 모듈을 도입하여 GhostNet가 비슷한 비용의 경량 모델보다 더 적은 파라미터로 성능을 초과하도록 만들고, 기존 CNN에 plug-and-play 적용성과 ImageNet 및 COCO에서 강력한 결과를 시연한다.
Deploying convolutional neural networks (CNNs) on embedded devices is difficult due to the limited memory and computation resources. The redundancy in feature maps is an important characteristic of those successful CNNs, but has rarely been investigated in neural architecture design. This paper proposes a novel Ghost module to generate more feature maps from cheap operations. Based on a set of intrinsic feature maps, we apply a series of linear transformations with cheap cost to generate many ghost feature maps that could fully reveal information underlying intrinsic features. The proposed Ghost module can be taken as a plug-and-play component to upgrade existing convolutional neural networks. Ghost bottlenecks are designed to stack Ghost modules, and then the lightweight GhostNet can be easily established. Experiments conducted on benchmarks demonstrate that the proposed Ghost module is an impressive alternative of convolution layers in baseline models, and our GhostNet can achieve higher recognition performance (e.g. $75.7\%$ top-1 accuracy) than MobileNetV3 with similar computational cost on the ImageNet ILSVRC-2012 classification dataset. Code is available at https://github.com/huawei-noah/ghostnet
연구 동기 및 목표
- 모바일/장치에서의 효율적인 CNN 설계를 특징 맵의 중복성을 활용하여 동기부여한다.
- 적은 수의 고유 맵으로부터 많은 특징 맵을 생성하는 저가 연산으로 Ghost 모듈을 제안한다.
- Ghost 모듈이 기존 아키텍처의 표준 컨볼루션을 대체하여 경량이면서도 정확한 네트워크(GhostNet)를 형성할 수 있음을 입증한다.
- 최신의 컴팩트 모델과 비교하여 ImageNet 분류와 MS COCO 물체 검출에서의 성능 향상을 검증한다.
제안 방법
- 표준 컨볼루션을 고유 특징 맵을 생성하는 기본 컨볼루션과 저가 선형 변환의 집합으로 분할하여 Ghost 특징 맵을 생성한다.
- 첫 번째로 채널을 확장하고 두 번째로 축약하여 단축 경로와 일치시켜 Ghost Bottleneck(G-bneck)을 형성하는 Ghost 모듈을 Ghost bottleneck마다 두 개 사용한다.
- MobileNetV3류 아키텍처의 벤톱넥 블록을 Ghost bottleneck으로 교체하여 GhostNet을 구축한다.
- GhostNet에서 기본 컨볼루션 커널 크기를 1x1로 설정하고 s=2(블록당 고유 맵 n/s 생성), d=깊이 방향 변환의 커널 크기로 설정한다.
- 특정 잔여 경로에 대해 Squeeze-and-Excite(SE) 모듈을 선택적으로 적용한다.
- GhostNet의 복잡도를 스케일링하기 위한 폭 곱수 alpha를 제공한다.
실험 결과
연구 질문
- RQ1두 단계 Ghost 모듈(고유 맵과 저가 선형 변환)의 조합이 정확도를 유지하면서 계산량을 줄일 수 있는가?
- RQ2MobileNetV3류 백본에 통합된 Ghost bottleneck이 최신의 컴팩트 모델과 비교해 ImageNet과 COCO에서 우수한 정확도-효율성 트레이드오프를 제공하는가?
- RQ3초기 확장 매개변수 s(고유 맵의 확장)와 d(선형 변환의 커널 크기)가 벤치마크 데이터셋에서 정확도와 FLOPs에 어떤 영향을 주는가?
주요 결과
- Ghost 모듈은 CIFAR-10, ImageNet, COCO 벤치마크에서 정확도를 유지하거나 향상시키면서 FLOPs와 파라미터를 크게 줄일 수 있다.
- ImageNet 분류에서 GhostNet은 여러 복잡도 수준에서 비슷한 계산 비용으로 MobileNetV3보다 상위 1등 정확도에 도달한다(예: GhostNet-1.0x는 약 141 MFLOPs에서 73.9% 상위 정확도).
- GhostNet은 폭 승수 up to 1.3x에서 약 226 MFLOPs에서 75.7% 상위 정확도를 달성하며 일부 컴팩트 구조를 능가한다.
- 모바일에 적합한 속도를 위해 GhostNet은 ARM/TF Lite 벤치마크의 유사한 정확도 수준에서 비교 가능한 MobileNetV3 구현보다 더 빠른 실제 추론 속도를 제공한다.
- COCO 물체 검출에서 GhostNet 기반 백본은 MobileNetV2/V3 백본 대비 경쟁력 있는 mAP(예: 약 164-300 MFLOPs에서 26.6-26.9%)를 제공한다.
- GhostNet은 강력한 특징 맵 효율성을 보여주며, 전통적 컨볼루션의 큰 부분을 저가 선형 변환으로 대체하여 상당한 이점을 얻는다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.