[论文解读] XceptionTime: A Novel Deep Architecture based on Depthwise Separable Convolutions for Hand Gesture Classification
提出 XceptionTime,一种深度模型,使用深度可分离卷积、自适应平均池化和 mu-law 归一化,从稀疏多通道 sEMG 中对 52 个手势进行分类,在 NinaPro DB1 上达到 93.91%,并降低参数数量。
Capitalizing on the need for addressing the existing challenges associated with gesture recognition via sparse multichannel surface Electromyography (sEMG) signals, the paper proposes a novel deep learning model, referred to as the XceptionTime architecture. The proposed innovative XceptionTime is designed by integration of depthwise separable convolutions, adaptive average pooling, and a novel non-linear normalization technique. At the heart of the proposed architecture is several XceptionTime modules concatenated in series fashion designed to capture both temporal and spatial information-bearing contents of the sparse multichannel sEMG signals without the need for data augmentation and/or manual design of feature extraction. In addition, through integration of adaptive average pooling, Conv1D, and the non-linear normalization approach, XceptionTime is less prone to overfitting, more robust to temporal translation of the input, and more importantly is independent from the input window size. Finally, by utilizing the depthwise separable convolutions, the XceptionTime network has far fewer parameters resulting in a less complex network. The performance of XceptionTime is tested on a sub Ninapro dataset, DB1, and the results showed a superior performance in comparison to any existing counterparts. In this regard, 5:71% accuracy improvement, on a window size 200ms, is reported in this paper, for the first time.
研究动机与目标
- 解决来自稀疏多通道 sEMG 信号的手势识别挑战。
- 开发一个新的端到端架构,在不使用数据增强或手工特征工程的情况下捕捉时空特征。
- 在保持高准确性和输入窗口大小无关性的同时降低模型复杂度。
提出的方法
- 引入带有并行路径的 XceptionTime 模块,使用深度可分离卷积和瓶颈来降低维度。
- 堆叠多个 XceptionTime 模块并通过残差连接形成架构。
- 在分类器中使用自适应平均池化以实现输入窗口大小无关性。
- 对 sEMG 信号应用非线性 mu-law 归一化以提高鲁棒性和训练速度。
- 使用 Conv1x1 投影和批量归一化进行训练,将特征映射到 52 个手势类别。
实验结果
研究问题
- RQ1深度可分离卷积是否能够在保持或提高稀疏 sEMG 手势数据准确率的同时减少模型参数?
- RQ2相较于线性归一化,mu-law 非线性归一化是否能提高分类性能?
- RQ3XceptionTime 架构是否对不同输入窗口大小具有鲁棒性而无需重新配置?
- RQ4在准确度与复杂度方面,XceptionTime 与 NinaPro DB1 数据集上的最先进模型相比如何?
主要发现
- XceptionTime 在 NinaPro DB1、10 通道、200 ms 窗口条件下实现 93.91% 的准确率。
- 用标准卷积替换深度可分离卷积(XceptionTime-V2)使参数从 413,516 增加到 1,918,476,且在 200 ms 窗口下准确率下降(95.43% vs 94.59%)。
- mu-law 归一化比 Minmax 归一化获得更高的准确率(例如 50 ms 窗口:81.71% with mu-law vs 71.49% with Minmax)。
- 由于自适应池化,模型在不同窗口长度下仍然有效,无需重新配置架构。
- 在学习过程中使用多种窗口大小进行训练在大多数窗口长度上提升了性能,除了 50 ms,表明对时间平移和窗口变化具有鲁棒性。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。