QUICK REVIEW

[论文解读] Ultra-Lightweight Network for Ship-Radiated Sound Classification on Embedded Deployment

Sangwon Park, Dongjun Kim|arXiv (Cornell University)|Jan 20, 2026

Speech Recognition and Synthesis被引用 0

一句话总结

ShuffleFAC 是一个轻量级、适用于嵌入式设备的频率感知网络，用于船舶辐射声分类，在 Raspberry Pi 上以极少的参数量和低延迟实现具有竞争力的宏 F1。γ=16 时，达到 71.45% 的宏 F1，参数量为 39K，MACs 3.06M，推理时延 6.05 ms。

ABSTRACT

This letter presents ShuffleFAC, a lightweight acoustic model for ship-radiated sound classification in resource-constrained maritime monitoring systems. ShuffleFAC integrates Frequency-Aware convolution into an efficiency-oriented backbone using separable convolution, point-wise group convolution, and channel shuffle, enabling frequency-sensitive feature extraction with low computational cost. Experiments on the DeepShip dataset show that ShuffleFAC achieves competitive performance with substantially reduced complexity. In particular, ShuffleFAC ($γ=16$) attains a macro F1-score of 71.45 $\pm$ 1.18% using 39K parameters and 3.06M MACs, and achieves an inference latency of 6.05 $\pm$ 0.95ms on a Raspberry Pi. Compared with MicroNet0, it improves macro F1-score by 1.82 % while reducing model size by 9.7x and latency by 2.5x. These results indicate that ShuffleFAC is suitable for real-time embedded UATR.

研究动机与目标

在严格资源约束下解决准确的船舶辐射声分类需求。
开发一个高效模型，能够在光谱图输入上保留频率感知特征提取。
在保持有竞争力的分类性能的同时，降低计算与部署开销。

提出的方法

引入 Frequency Adaptive Separable Convolution (FASC)，通过可学习的位置编码注入频率-位置信息。
将 FA 块嵌入通道置换的骨干网络，形成 ShuffleFAC，利用通道压缩、分组卷积和通道置换来降低 MACs。
使用交叉熵损失、SGD/Adam 优化器设置和批量大小 48，在最多 200 个时代进行训练。
通过架构对数-梅尔 (log-Mel) spectrogram 输入，最后经过全局平均池化和线性分类器。

Figure 1 : Raspberry Pi 5: Resource-constraint platform

实验结果

研究问题

RQ1频率感知卷积方法结合高效骨干是否能够实现嵌入式船舶辐射声实时分类？
RQ2在资源受限设备上，该模型的模型尺寸、MACs 与嵌入式推理延迟之间的权衡如何？
RQ3与现有轻量化架构相比，ShuffleFAC 在嵌入式硬件上的准确性与实用性表现如何？

主要发现

ShuffleFAC γ=16 在 39K 参数和 3.06M MACs 下实现宏 F1 为 71.45%。
在 Raspberry Pi 上，ShuffleFAC γ=16 的推理时延为 6.05 ms，推断每次的能量估计为 15.14 μWh。
ShuffleFAC 在宏 F1 上比 MicroNet0 高出 1.82 个百分点，同时模型尺寸缩小 9.7×、延迟缩短 2.5×。
在 γ 配置中，较小的 γ（如 8）带来更低的时延和能量，而 γ=32 在不同权衡下提供可与 γ=16 相当的准确性。
ShuffleFAC 展示了有利的精度–效率平衡，适用于实时嵌入式 UATR 部署。

Figure 2 : Illustrations of (a) Frequency Adaptive Separable Convolution module, (b) Frequency aware pipeline

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。