Skip to main content
QUICK REVIEW

[論文レビュー] Ultra-Lightweight Network for Ship-Radiated Sound Classification on Embedded Deployment

Sangwon Park, Dongjun Kim|arXiv (Cornell University)|Jan 20, 2026
Speech Recognition and Synthesis被引用数 0
ひとこと要約

ShuffleFACは埋込みデバイス上で船舶発出音分類を行う軽量の周波数認識ネットワークで、Raspberry Pi上で非常に少ないパラメータと低遅延で競争力の macro F1 を達成します。γ=16のとき、39Kパラメータ、3.06M MACs、6.05 msの推論で71.45%の macro F1に達します。

ABSTRACT

This letter presents ShuffleFAC, a lightweight acoustic model for ship-radiated sound classification in resource-constrained maritime monitoring systems. ShuffleFAC integrates Frequency-Aware convolution into an efficiency-oriented backbone using separable convolution, point-wise group convolution, and channel shuffle, enabling frequency-sensitive feature extraction with low computational cost. Experiments on the DeepShip dataset show that ShuffleFAC achieves competitive performance with substantially reduced complexity. In particular, ShuffleFAC ($γ=16$) attains a macro F1-score of 71.45 $\pm$ 1.18% using 39K parameters and 3.06M MACs, and achieves an inference latency of 6.05 $\pm$ 0.95ms on a Raspberry Pi. Compared with MicroNet0, it improves macro F1-score by 1.82 % while reducing model size by 9.7x and latency by 2.5x. These results indicate that ShuffleFAC is suitable for real-time embedded UATR.

研究の動機と目的

  • 厳しいリソース制約下での正確な船舶発出音分類のニーズに対応する。
  • スペクトログラム入力の周波数認識機能を保持する効率的なモデルを開発する。
  • 競争力のある分類性能を維持しつつ計算とデプロイのオーバーヘッドを削減する。

提案手法

  • Frequency Adaptive Separable Convolution(FASC)を導入し、学習可能な位置エンコーディングを介して周波数-位置情報を注入する。
  • FAブロックをチャンネルシャッフルバックボーンに組み込み、ShuffleFACを形成する。これによりチャンネル圧縮、グループ畳み込み、チャンネルシャッフルを用いてMACsを削減する。
  • クロスエントロピー損失でSGD/Adamオプティマイザ設定とバッチサイズ48を用い最大200エポックで訓練する。
  • ログMelスペクトログラム入力をアーキテクチャを通して処理し、最終的にグローバル平均プーリングと線形分類器で終える。
Figure 1 : Raspberry Pi 5: Resource-constraint platform
Figure 1 : Raspberry Pi 5: Resource-constraint platform

実験結果

リサーチクエスチョン

  • RQ1周波数認識の畳み込みアプローチと効率的なバックボーンを組み合わせることでリアルタイムの埋込み型船舶発出音分類を実現できるか。
  • RQ2このようなモデルのリソース制約下でのモデルサイズ、MACs、埋込み推論遅延のトレードオフはどうなるか。
  • RQ3ShuffleFACは埋込みハードウェア上での精度と実用性の面で既存の軽量アーキテクチャとどう比較されるか。

主な発見

ModelAccuracy (%)F1-score (%)# of ParamsMACst_inf (ms)E_est (μWh)
ShuffleFAC ( γ=64 )70.26±0.5270.17±0.79546 K34.64 M10.86±0.8427.16±2.11
ShuffleFAC ( γ=32 )71.44±1.7171.66±1.74143 K9.85 M7.49±1.3118.73±3.29
ShuffleFAC ( γ=16 )71.31±1.3471.45±1.1839 K3.06 M6.05±0.9515.14±2.37
ShuffleFAC ( γ=8 )69.15±1.4669.38±1.6711 K1.06 M5.48±0.7013.71±1.77
  • ShuffleFAC γ=16は39Kパラメータ、3.06M MACsでmacro F1が71.45%。
  • Raspberry Pi上で ShuffleFAC γ=16 は推論遅延6.05 ms、推定エネルギー15.14 μWh/推論を示す。
  • ShuffleFAC は Macro F1で MicroNet0を1.82ポイント上回り、モデルサイズを9.7×削減、遅延を2.5×削減。
  • γ構成全体で、より小さな γ(例: 8)は遅延とエネルギーを低くする一方、γ=32は γ=16と同等の精度を別のトレードオフで提供。
  • ShuffleFAC は精度–効率のバランスが有利で、リアルタイムの埋込み型 UATR 展開に適している。
Figure 2 : Illustrations of (a) Frequency Adaptive Separable Convolution module, (b) Frequency aware pipeline
Figure 2 : Illustrations of (a) Frequency Adaptive Separable Convolution module, (b) Frequency aware pipeline

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。