QUICK REVIEW

[論文レビュー] UniMiB SHAR: a new dataset for human activity recognition using acceleration data from smartphones

Daniela Micucci, Marco Mobilio|arXiv (Cornell University)|Nov 23, 2016

Context-Aware Activity Recognition Systems参考文献 41被引用数 31

ひとこと要約

本論文では、30名の被験者（年齢18–60歳）が9つの日常生活動作（ADL）および8種類の転倒を実施したスマートフォンの加速度計データから構成される新しい公開データセット、UniMiB SHARを紹介する。このデータセットは被験者依存および被騢者非依存の評価をサポートしており、転倒分類が日常生活動作認識よりも困難であることが明らかになった。また、被験者非依存設定では、生データよりも大きさに基づく特徴量が優れた性能を示した。

ABSTRACT

Smartphones, smartwatches, fitness trackers, and ad-hoc wearable devices are being increasingly used to monitor human activities. Data acquired by the hosted sensors are usually processed by machine-learning-based algorithms to classify human activities. The success of those algorithms mostly depends on the availability of training (labeled) data that, if made publicly available, would allow researchers to make objective comparisons between techniques. Nowadays, publicly available data sets are few, often contain samples from subjects with too similar characteristics, and very often lack of specific information so that is not possible to select subsets of samples according to specific criteria. In this article, we present a new dataset of acceleration samples acquired with an Android smartphone designed for human activity recognition and fall detection. The dataset includes 11,771 samples of both human activities and falls performed by 30 subjects of ages ranging from 18 to 60 years. Samples are divided in 17 fine grained classes grouped in two coarse grained classes: one containing samples of 9 types of activities of daily living (ADL) and the other containing samples of 8 types of falls. The dataset has been stored to include all the information useful to select samples according to different criteria, such as the type of ADL, the age, the gender, and so on. Finally, the dataset has been benchmarked with four different classifiers and with two different feature vectors. We evaluated four different classification tasks: fall vs no fall, 9 activities, 8 falls, 17 activities and falls. For each classification task we performed a subject-dependent and independent evaluation. The major findings of the evaluation are the following: i) it is more difficult to distinguish between types of falls than types of activities; ii) subject-dependent evaluation outperforms the subject-independent one

研究の動機と目的

人間の行動認識（HAR）および転倒検出のための、公開可能で多様性に富み、正確にラベル付けされたスマートフォン加速度計データセットの不足に対処する。
年齢、性別、行動タイプなどの被験者固有の基準に基づいたサンプル選択が可能なデータセットを構築する。
被験者依存および被験者非依存の両条件下で、HARおよび転倒検出アルゴリズムの評価のためのベンチマークを提供する。
多様なユーザー間で分類性能を向上させるための、頑健な特徴工学およびパーソナライゼーション技術に関する研究を支援する。
標準化された、公開可能なデータセットを用いて、最先端のHARおよび転倒検出手法の客観的比較を促進する。

提案手法

18–60歳の幅広い年齢層にわたる30名の被験者から、Androidスマートフォンを用いて合計11,771件の加速度サンプルを収集した。
行動を9つのADLと8種類の転倒タイプに分類し、2つの粗いカテゴリ（ADLと転倒）にグループ化した。
年齢、性別、行動タイプなどのすべてのメタデータを保存し、特定の基準に基づいたフィルタリングおよびサブセット選択を可能にした。
生加速度データおよび三軸加速度のノルム（大きさ）の2つの特徴ベクトルを抽出した。
k-近傍法（k-NN）、サポートベクターマシン（SVM）、ランダムフォレスト（RF）、ロジスティック回帰の4つの分類器を、両方の特徴ベクトルに対して評価した。
被験者依存評価は5分割交差検証、被験者非依存評価は1人を除いた交差検証（LOSO）を用いて実施した。

実験結果

リサーチクエスチョン

RQ1被験者依存および被験者非依存評価設定におけるHARおよび転倒検出モデルの性能は、どのように異なるか？
RQ2生加速度と大きさのどちらの特徴表現が、異なる評価プロトコルにおいてより高い分類精度を達成するか？
RQ3異なる種類の転倒を識別することは、異なる種類のADLを識別することよりも困難であるか？
RQ4パーソナライゼーション（被験者固有のデータ）は、HARおよび転倒検出における分類性能にどの程度影響を与えるか？
RQ5このデータセットは、より頑健な特徴およびパーソナライゼーションに配慮した分類スキームの開発を支援できるか？

主な発見

被験者依存評価では、被験者非依存評価よりも顕著に高い精度が達成され、SVMと大きさを用いた転倒 vs. 非転倒分類で最高の平均精度（MAA）97.57％を記録した。
F-8（8種類の転倒）の識別は、A-9（9種類のADL）の認識よりも困難であり、被験者非依存評価でSVMと大きさを用いた場合の最高MAAは49.35％であった。
ADL認識（A-9）においては、被験者非依存評価でRFと生データを用いた場合に最高のMAA73.17％を記録したが、これは被験者依存評価結果と比較して顕著な性能ギャップを示した。
被験者非依存評価では、大きさに基づく特徴量が生データを上回った。これは、被験者固有の変動に対してより頑健であることを示唆している。
17クラスタスク（AF-17）における最高全体の性能は、被験者非依存評価でRFと大きさを用いた場合に56.58％のMAAを記録した。これは、被験者間での細分化分類の困難さを示している。
k-NNを用いたAF-17の混同行列では、類似した転倒タイプ間で高い誤分類率が観察され、加速度データに重複するパターンが存在することが示された。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。