[논문 리뷰] Ultra-Lightweight Network for Ship-Radiated Sound Classification on Embedded Deployment
ShuffleFAC는 임베디드 디바이스에서 선박 방사 소리 분류를 위한 가벼운 주파수 의존 네트워크로, 매우 적은 매개변수와 낮은 대기시간으로 Raspberry Pi에서 경쟁력 있는 macro F1을 달성합니다. γ=16일 때 39K 매개변수, 3.06M MACs, 6.05 ms 추론으로 71.45% macro F1에 도달합니다.
This letter presents ShuffleFAC, a lightweight acoustic model for ship-radiated sound classification in resource-constrained maritime monitoring systems. ShuffleFAC integrates Frequency-Aware convolution into an efficiency-oriented backbone using separable convolution, point-wise group convolution, and channel shuffle, enabling frequency-sensitive feature extraction with low computational cost. Experiments on the DeepShip dataset show that ShuffleFAC achieves competitive performance with substantially reduced complexity. In particular, ShuffleFAC ($γ=16$) attains a macro F1-score of 71.45 $\pm$ 1.18% using 39K parameters and 3.06M MACs, and achieves an inference latency of 6.05 $\pm$ 0.95ms on a Raspberry Pi. Compared with MicroNet0, it improves macro F1-score by 1.82 % while reducing model size by 9.7x and latency by 2.5x. These results indicate that ShuffleFAC is suitable for real-time embedded UATR.
연구 동기 및 목표
- 자원 제약이 엄격한 상황에서 선박 방사 소리 분류의 정확성 필요성 해결.
- 주파수 인지 특징 추출을 보존하는 효율적인 spectrogram 입력 모델 개발.
- 계산 및 배포 오버헤드를 줄이면서도 경쟁력 있는 분류 성능 유지.
제안 방법
- 주파수 위치 정보를 학습 가능한 위치 인코딩으로 주입하는 Frequency Adaptive Separable Convolution (FASC) 도입.
- 채널 압축, 그룹 합성곱, 채널 셔플을 사용하여 MACs를 줄이도록 ShuffleFAC를 형성하는 채널 셔플 백본에 FA 블록 삽입.
- SGD/Adam 옵티마이저 설정과 배치 크기 48로 최대 200 에포크까지 교차 엔트로피 손실로 학습.
- 아키텍처를 통해 로그-멜 스펙트로그램 입력을 처리하고, 전역 평균 풀링과 선형 분류기로 마무리.

실험 결과
연구 질문
- RQ1주파수 인지 컨볼루션 접근 방식과 효율적인 백본이 실시간 임베디드 선박 방사 소리 분류를 가능하게 할 수 있는가?
- RQ2자원 제약 장치에서 모델 크기, MACs, 임베디드 추론 대기 시간 간의 트레이드오프는 어떠한가?
- RQ3ShuffleFAC가 임베디드 하드웨어에서 기존 경량 아키텍처와 비교했을 때 정확도와 실용성 측면에서 어떤 차이가 있는가?
주요 결과
- ShuffleFAC γ=16은 39K 매개변수와 3.06M MACs로 macro F1 71.45%를 달성합니다.
- Raspberry Pi에서 ShuffleFAC γ=16은 추론 지연 6.05 ms 및 추정 에너지 15.14 μWh per inference를 보였습니다.
- ShuffleFAC는 Macro F1에서 MicroNet0보다 1.82 포인트 우수한 반면 모델 크기는 9.7× 축소되고 지연은 2.5× 감소했습니다.
- γ 구성 전반에 걸쳐 더 작은 γ(예: 8)가 더 낮은 대기 시간과 에너지를 제공하고, γ=32는 서로 다른 트레이드오프를 가지며 γ=16과 비슷한 정확도를 제공합니다.
- ShuffleFAC는 정확도-효율성의 균형이 우수하여 실시간 임베디드 UATR 배치에 적합합니다.

더 나은 연구,지금 바로 시작하세요
연구 설계부터 논문 작성까지, 연구 시간을 획기적으로 줄여보세요.
카드 등록 없음 · 무료 플랜 제공
이 리뷰는 AI가 만들고, 인간 에디터가 검토했습니다.