[论文解读] UniMiB SHAR: a new dataset for human activity recognition using acceleration data from smartphones
本论文介绍了UniMiB SHAR,一个全新的公开智能手机加速度计数据集,包含30名受试者(年龄18–60岁)执行9种日常生活活动(ADLs)和8种跌倒类型的加速度数据。该数据集支持基于受试者的评估与不基于受试者的评估,结果显示跌倒分类比ADL识别更具挑战性,且基于幅值的特征优于原始数据在不基于受试者的设置下的表现。
Smartphones, smartwatches, fitness trackers, and ad-hoc wearable devices are being increasingly used to monitor human activities. Data acquired by the hosted sensors are usually processed by machine-learning-based algorithms to classify human activities. The success of those algorithms mostly depends on the availability of training (labeled) data that, if made publicly available, would allow researchers to make objective comparisons between techniques. Nowadays, publicly available data sets are few, often contain samples from subjects with too similar characteristics, and very often lack of specific information so that is not possible to select subsets of samples according to specific criteria. In this article, we present a new dataset of acceleration samples acquired with an Android smartphone designed for human activity recognition and fall detection. The dataset includes 11,771 samples of both human activities and falls performed by 30 subjects of ages ranging from 18 to 60 years. Samples are divided in 17 fine grained classes grouped in two coarse grained classes: one containing samples of 9 types of activities of daily living (ADL) and the other containing samples of 8 types of falls. The dataset has been stored to include all the information useful to select samples according to different criteria, such as the type of ADL, the age, the gender, and so on. Finally, the dataset has been benchmarked with four different classifiers and with two different feature vectors. We evaluated four different classification tasks: fall vs no fall, 9 activities, 8 falls, 17 activities and falls. For each classification task we performed a subject-dependent and independent evaluation. The major findings of the evaluation are the following: i) it is more difficult to distinguish between types of falls than types of activities; ii) subject-dependent evaluation outperforms the subject-independent one
研究动机与目标
- 解决公开可用、多样化且标注良好的智能手机加速度计数据集在人体活动识别(HAR)和跌倒检测方面的缺乏问题。
- 创建一个可基于受试者特定标准(如年龄、性别和活动类型)选择样本的数据集。
- 提供一个基准,用于在基于受试者和不基于受试者的条件下评估HAR和跌倒检测算法。
- 支持针对鲁棒特征工程与个性化技术的研究,以提升在多样化用户中的分类性能。
- 通过一个标准化的公开数据集,促进最先进HAR与跌倒检测方法之间的客观比较。
提出的方法
- 使用安卓智能手机从30名参与者中采集了11,771个加速度样本,覆盖广泛的年龄范围(18–60岁)。
- 将活动分类为9种ADLs和8种跌倒类型,并归入两个粗粒度类别:ADLs和跌倒。
- 存储所有元数据(年龄、性别、活动类型),以支持基于特定标准的过滤与子集选择。
- 提取两种特征向量:原始加速度数据和幅值(三轴加速度的欧几里得范数)。
- 在两种特征向量上评估四种分类器——k-最近邻(k-NN)、支持向量机(SVM)、随机森林(RF)和逻辑回归。
- 通过5折交叉验证进行基于受试者的评估,通过留一受试者(LOSO)交叉验证进行不基于受试者的评估。
实验结果
研究问题
- RQ1HAR与跌倒检测模型在基于受试者与不基于受试者评估设置下的性能表现有何差异?
- RQ2在不同评估协议下,原始加速度与幅值特征表示中,哪种能带来更高的分类准确率?
- RQ3区分不同类型的跌倒与区分不同类型的ADLs相比,难度如何?
- RQ4个性化(基于受试者的数据)在HAR与跌倒检测中对分类性能的影响有多大?
- RQ5该数据集能否支持更鲁棒特征与个性化感知分类方案的开发?
主要发现
- 基于受试者的评估显著优于不基于受试者的评估,基于SVM与幅值的跌倒 vs. 无跌倒分类最高平均准确率(MAA)达到97.57%。
- 区分不同类型的跌倒(F-8)比识别ADLs(A-9)更具挑战性,不基于受试者评估下F-8的最佳MAA为49.35%(使用SVM与幅值)。
- 对于ADL识别(A-9),不基于受试者评估下最佳MAA为73.17%(使用RF与原始数据),表明与基于受试者的性能存在显著差距。
- 在不基于受试者的评估中,基于幅值的特征优于原始数据,表明其对受试者特异性差异具有更强的鲁棒性。
- 17类任务(AF-17)的最佳整体性能为56.58% MAA(使用RF与幅值,在不基于受试者评估下),凸显跨受试者细粒度分类的困难。
- 使用k-NN的AF-17混淆矩阵显示,相似类型的跌倒之间存在较高的误分类率,表明加速度数据中存在重叠模式。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。