QUICK REVIEW

[論文レビュー] ECA-Net: Efficient Channel Attention for Deep Convolutional Neural Networks

Qilong Wang, Banggu Wu|arXiv (Cornell University)|Oct 8, 2019

Advanced Neural Network Applications参考文献 33被引用数 379

ひとこと要約

ECA-Net は、次元削減を省略し、適応カーネルサイズを持つ 1D 畳み込みを用いて局所的なチャネル間相互作用を捉える、Efficient Channel Attention モジュールを導入します。これにより追加パラメータを最小化しつつ性能向上を達成します。ImageNet分類およびCOCO検出/セマンティックセグメンテーション全般で、既存の注意モジュールより低い複雑さで競争力のあるまたは優れた結果を達成します。

ABSTRACT

Recently, channel attention mechanism has demonstrated to offer great potential in improving the performance of deep convolutional neural networks (CNNs). However, most existing methods dedicate to developing more sophisticated attention modules for achieving better performance, which inevitably increase model complexity. To overcome the paradox of performance and complexity trade-off, this paper proposes an Efficient Channel Attention (ECA) module, which only involves a handful of parameters while bringing clear performance gain. By dissecting the channel attention module in SENet, we empirically show avoiding dimensionality reduction is important for learning channel attention, and appropriate cross-channel interaction can preserve performance while significantly decreasing model complexity. Therefore, we propose a local cross-channel interaction strategy without dimensionality reduction, which can be efficiently implemented via $1D$ convolution. Furthermore, we develop a method to adaptively select kernel size of $1D$ convolution, determining coverage of local cross-channel interaction. The proposed ECA module is efficient yet effective, e.g., the parameters and computations of our modules against backbone of ResNet50 are 80 vs. 24.37M and 4.7e-4 GFLOPs vs. 3.86 GFLOPs, respectively, and the performance boost is more than 2% in terms of Top-1 accuracy. We extensively evaluate our ECA module on image classification, object detection and instance segmentation with backbones of ResNets and MobileNetV2. The experimental results show our module is more efficient while performing favorably against its counterparts.

研究の動機と目的

モデルの複雑さと性能の観点からチャネル注意機構を動機づけ、分析する。
次元削減を避けつつクロスチャネル相互作用を捉える軽量な注意モジュールを提案する。
1D畳み込みの適応カーネルサイズが有効なチャネル注意を生むことを示す。
画像分類、物体検出、インスタンスセグメンテーションのタスクにわたって ECA-Net を評価する。

提案手法

SEブロックを再検討し、次元削減とクロスチャネル相互作用の効果を分析する。
ECAを提案する：完全連結による励起を、次元削減なしでチャネルごとにプールされた特徴に対して1D畳み込み（C1D）へ置換する。
1D畳み込みの適応カーネルサイズ k を、チャネル次元 C の非線形写像によって決定する。
既存のバックボーンにおけるSEブロックを置換するプラグインモジュールとしてECAを実装する（ECA-Net）。
PyTorch実装を提供し、パラメータ数、FLOPs、および精度の改善を報告する。

実験結果

リサーチクエスチョン

RQ1次元削減を回避することは、SEブロックと比較してチャネル注意学習を改善しますか？
RQ2軽量な1D畳み込みで捕捉される局所的なクロスチャネル相互作用は、最小限のパラメータで競争力のある利得を達成しますか？
RQ31D畳み込みの適応カーネルサイズは、さまざまなCNNバックボーンとタスクで有益ですか？
RQ4ImageNet分類およびCOCO物体検出/インスタンスセグメンテーションにおけるECA-Netの性能は、同等手法と比べてどうですか？

主な発見

次元削減のないECAは、削減ありの variant を一貫して上回り、はるかに少ないパラメータで利益を達成する。
チャネル次元により適応されるカーネルサイズ k を持つ1D畳み込みは、局所的なクロスチャネル相互作用を効果的にモデル化する。
ResNet-50（24.37Mパラメータ）では、ECA-Netは80パラメータと4.7e-4 GFLOPsを追加し、Top-1を2.28%改善する。
ECA-NetはImageNet全体でSENet/CBAM/GCNet/A2-Netより競争力のあるまたは優れた性能を低い複雑さで示す。
MobileNetV2 では、SEブロックと比較して最小のパラメータとFLOP増加で精度向上をもたらす。
MS COCO の検出器（Faster R-CNN、Mask R-CNN、RetinaNet）において、ベースラインResNetおよびSEブロックより改善をもたらし、小物体での性能向上を含む。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。