QUICK REVIEW

[论文解读] Deep Activity Recognition Models with Triaxial Accelerometers

Mohammad Abu Alsheikh, Ahmed Selim|arXiv (Cornell University)|Nov 15, 2015

Context-Aware Activity Recognition Systems参考文献 26被引用 129

一句话总结

本文提出使用三轴加速度计的深度学习模型以提升人体活动识别性能，通过无监督预训练和分层特征学习，优于浅层模型。提出了一种混合深度学习-HMM方法，将深度特征表示与时间建模相结合，在序列活动识别上达到99.13%的准确率，显著优于当前最先进方法。

ABSTRACT

Despite the widespread installation of accelerometers in almost all mobile phones and wearable devices, activity recognition using accelerometers is still immature due to the poor recognition accuracy of existing recognition methods and the scarcity of labeled training data. We consider the problem of human activity recognition using triaxial accelerometers and deep learning paradigms. This paper shows that deep activity recognition models (a) provide better recognition accuracy of human activities, (b) avoid the expensive design of handcrafted features in existing systems, and (c) utilize the massive unlabeled acceleration samples for unsupervised feature extraction. Moreover, a hybrid approach of deep learning and hidden Markov models (DL-HMM) is presented for sequential activity recognition. This hybrid approach integrates the hierarchical representations of deep activity recognition models with the stochastic modeling of temporal sequences in the hidden Markov models. We show substantial recognition improvement on real world datasets over state-of-the-art methods of human activity recognition using triaxial accelerometers.

研究动机与目标

解决基于加速度计的活动识别系统中识别准确率低和标注数据稀缺的问题。
通过深度学习自动从原始加速度数据中提取分层表征，消除对手工设计特征的依赖。
通过混合深度学习与隐马尔可夫模型（DL-HMM）框架，改进对序列活动的时间建模。
评估无监督预训练和过完备深度信念网络在提升识别性能方面的有效性。
在真实世界数据集上展示优于传统浅层模型和基于HMM方法的优越性能。

提出的方法

使用受限玻尔兹曼机（RBMs）构建深度信念网络（DBNs），在无标签加速度数据上进行无监督预训练，以初始化深层网络权重。
采用混合DL-HMM架构，其中深度神经网络的输出作为隐马尔可夫模型的发射概率，用于建模活动的时间序列。
应用原始三轴加速度信号的语谱图表示，以增强特征多样性并提升模型泛化能力。
实施两阶段训练流程：先使用生成式RBMs进行预训练，再通过反向传播进行判别式微调。
使用过完备表征（输入大小的四倍）优化深层模型，以提升训练稳定性和深层架构的性能。
使用深度模型的后验概率作为HMM中的发射矩阵，以建模序列活动的转换关系和初始状态分布。

实验结果

研究问题

RQ1在无标签加速度数据上训练的深度学习模型是否能相比浅层模型提升活动识别准确率？
RQ2使用RBMs进行无监督预训练是否能提升深度活动识别模型的泛化能力和性能？
RQ3加速度信号的语谱图表示在多大程度上能改善特征学习和识别准确率？
RQ4混合DL-HMM框架是否能比独立的HMM或深度学习模型更好地建模人类活动的时间序列？
RQ5与欠完备架构相比，过完备深层架构在优化和识别性能方面表现如何？

主要发现

每层500个神经元的四层深度信念网络在WISDM数据集上达到97.85%的识别准确率，显著优于浅层模型。
混合DL-HMM方法在Skoda检查点数据集上达到99.13%的准确率，比标准HMM高出3.38%，且显著优于基线方法。
生成式预训练使深层模型（5层DBN）的识别准确率最高提升1.38%，证明其在深层网络优化中的关键作用。
过完备表征（4倍输入大小）促进了更好的训练收敛和更高准确率，尤其在深层架构中表现更优。
使用语谱图输入显著提升了模型性能，能够捕捉加速度信号中的多频带和非周期性波动。
使用学习率为0.1、训练1000个周期的判别式微调显著提升了测试准确率，证实了完整训练流程的有效性。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。