[논문 리뷰] ECA-Net: Efficient Channel Attention for Deep Convolutional Neural Networks
ECA-Net은 차원 축소를 포기하고 적응형 커널 크기를 갖는 1D 컨볼루션을 사용하여 로컬 채널 간 상호작용을 포착하는 Efficient Channel Attention 모듈을 도입합니다. 이는 추가 매개변수를 최소화하면서 성능 향상을 제공합니다. ImageNet 분류 및 COCO 검출/세분화에 대해 기존 주의 모듈보다 낮은 복잡성으로 경쟁력 있는 혹은 우수한 결과를 달성합니다.
Recently, channel attention mechanism has demonstrated to offer great potential in improving the performance of deep convolutional neural networks (CNNs). However, most existing methods dedicate to developing more sophisticated attention modules for achieving better performance, which inevitably increase model complexity. To overcome the paradox of performance and complexity trade-off, this paper proposes an Efficient Channel Attention (ECA) module, which only involves a handful of parameters while bringing clear performance gain. By dissecting the channel attention module in SENet, we empirically show avoiding dimensionality reduction is important for learning channel attention, and appropriate cross-channel interaction can preserve performance while significantly decreasing model complexity. Therefore, we propose a local cross-channel interaction strategy without dimensionality reduction, which can be efficiently implemented via $1D$ convolution. Furthermore, we develop a method to adaptively select kernel size of $1D$ convolution, determining coverage of local cross-channel interaction. The proposed ECA module is efficient yet effective, e.g., the parameters and computations of our modules against backbone of ResNet50 are 80 vs. 24.37M and 4.7e-4 GFLOPs vs. 3.86 GFLOPs, respectively, and the performance boost is more than 2% in terms of Top-1 accuracy. We extensively evaluate our ECA module on image classification, object detection and instance segmentation with backbones of ResNets and MobileNetV2. The experimental results show our module is more efficient while performing favorably against its counterparts.
연구 동기 및 목표
- 모델 복잡도와 성능에 관해 채널 어텐션 메커니즘을 동기화하고 분석한다.
- 차원 축소 없는 경량 어텐션 모듈을 제안하면서 교차 채널 상호작용을 포착한다.
- 1D 컨볼루션의 적응형 커널 크기가 효과적인 채널 어텐션을 만들어내는지 입증한다.
- 이미지 분류, 객체 탐지 및 인스턴스 세분화 작업에서 ECA-Net을 평가한다.
제안 방법
- SE 블록을 재검토하여 차원 축소와 교차 채널 상호작용의 효과를 분석한다.
- ECA를 제안한다: 차원 축소 없이 채널별 풀링된 특성에 대해 1D 컨볼루션(C1D)을 사용하여 완전 연결적 excitation을 대체한다.
- 1D 컨볼루션의 커널 크기 k를 채널 차원 C의 비선형 매핑에 의해 결정되는 적응형 커널 크기로 사용한다.
- ECA를 기존 백본의 SE 블록을 대체하는 플러그인 모듈로 구현한다(ECA-Net).
- PyTorch 구현을 제공하고 매개변수 수, FLOPs, 정확도 향상을 보고한다.
실험 결과
연구 질문
- RQ1차원 축소를 피하는 것이 SE 블록과 비교하여 채널 주의 학습을 향상시키는가?
- RQ2경량 1D 컨볼루션으로 포착된 로컬 교차 채널 상호작용이 최소 매개변수로 경쟁력 있는 향상을 달성할 수 있는가?
- RQ3다양한 CNN 백본과 작업에서 1D 컨볼루션의 적응형 커널 크기가 유익한가?
- RQ4ImageNet 분류 및 COCO 객체 탐지/인스턴스 세분화에서 ECA-Net은 동료들과 비교했을 때 어떤 성능을 보이는가?
주요 결과
- 차원 축소 없이 ECA는 차원 축소를 포함한 변형보다 일관되게 우수하며, 훨씬 적은 매개변수로 이익을 달성한다.
- 커널 크기 k인 1D 컨볼루션은 (채널 차원에 의해 적응적으로 결정) 로컬 교차 채널 상호작용을 효과적으로 모델링한다.
- ResNet-50(매개변수 24.37M)에서 ECA-Net은 매개변수 80개와 FLOPs 4.7e-4 GFLOPs를 추가하고 Top-1을 2.28% 올렸다.
- ECA-Net은 ImageNet 전반에서 SENet/CBAM/GCNet/A2-Net 대비 경쟁력 있거나 우수한 성능을 보이며 더 낮은 복잡성으로 제공된다.
- MobileNetV2에서 SE 블록에 비해 매개변수 및 FLOP 증가가 최소한으로 ACC 향상을 제공한다.
- ECA는 또한 MS COCO 탐지기(Faster R-CNN, Mask R-CNN, RetinaNet)에서 기본 ResNet 및 SE 블록 대비 개선을 제공하며, 작은 물체에서의 성능도 더 좋다.
더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.