[論文レビュー] Deep Learning-Based Gait Recognition Using Smartphones in the Wild
本稿では、制約のない現実世界の条件下でスマートフォンの慣性センサを用いた深層学習ベースの歩行認識システムを提案する。スパatiotemporalな歩行特徴を加速度計およびジャイロスコープデータから抽出するため、ハイブリッドCNN-LSTMアーキテクチャを採用し、118名の被験者から得た2つのデータセットで、人物同定に93.5%、認証に93.7%の精度を達成した。
Compared to other biometrics, gait is difficult to conceal and has the advantage of being unobtrusive. Inertial sensors, such as accelerometers and gyroscopes, are often used to capture gait dynamics. These inertial sensors are commonly integrated into smartphones and are widely used by the average person, which makes gait data convenient and inexpensive to collect. In this paper, we study gait recognition using smartphones in the wild. In contrast to traditional methods, which often require a person to walk along a specified road and/or at a normal walking speed, the proposed method collects inertial gait data under unconstrained conditions without knowing when, where, and how the user walks. To obtain good person identification and authentication performance, deep-learning techniques are presented to learn and model the gait biometrics based on walking data. Specifically, a hybrid deep neural network is proposed for robust gait feature representation, where features in the space and time domains are successively abstracted by a convolutional neural network and a recurrent neural network. In the experiments, two datasets collected by smartphones for a total of 118 subjects are used for evaluations. The experiments show that the proposed method achieves higher than 93.5\% and 93.7\% accuracies in person identification and authentication, respectively.
研究の動機と目的
- 制約のない歩行シナリオにおいて、スマートフォンの慣性センサを用いて頑健な人物同定および認証を可能にすること。
- 制御された歩行経路や速度を必要とする従来の歩行認識手法の限界を克服すること。
- 生の加速度計およびジャイロスコープ時系列データから特徴を抽出できる深層学習フレームワークの開発。
- 多様な歩行条件下で収集された現実世界のデータセットを用いて、提案手法の性能を評価すること。
- オープンな研究を促進するため、データセット、コード、および訓練済みモデルを共有すること。
提案手法
- 完全畳み込みニューラルネットワークを用いて、慣性データを歩行時と非歩行時へセグメンテーションする。
- 時間軸に沿って生の慣性信号から時間的特徴を抽出するために、1次元畳み込みカーネル(1×9、1×3、1×3)を適用する。
- センサ軸間の特徴を空間的に相関付けるために6×1のカーネルを用い、出力の時系列性を保持する。
- 得られた128×16の特徴マップを時系列形式に再形状し、LSTMネットワークに供給して逐次モデリングを行う。
- ハイブリッドCNN-LSTMアーキテクチャにより、慣性センサデータから空間的および時間的歩行パターンの共同学習が可能となる。
- 特徴の識別性を高めるために、トリプレット損失関数およびコントラスト損失関数を用いてモデルを訓練する。
実験結果
リサーチクエスチョン
- RQ1制約のない歩行条件下で、スマートフォンの慣性センサを用いた深層学習モデルが、高い精度の歩行認識を達成できるか?
- RQ2提案されたCNN-LSTMモデルの性能は、単独のCNNまたはLSTMネットワークと比較してどのように異なるか?
- RQ3加速度計とジャイロスコープの両方のデータを組み合わせることで、単独で使用する場合と比較して認識精度が向上するか?
- RQ4データのアライメント(水平方向対比・垂直方向)が、人物認証タスクにおける深層学習モデルの性能に与える影響は何か?
- RQ5ステップベースのセグメンテーションと固定時間幅セグメンテーションのどちらが、LSTMベースの歩行認識において優れた性能を示すか?
主な発見
- 提案されたハイブリッドCNN-LSTMモデルは、現実世界のスマートフォン歩行データにおいて、人物同定で93.5%、認証で93.7%の精度を達成した。
- 加速度計データのみで認識性能が優れていたが、両方のセンサを組み合わせることで相補的な特徴学習により精度が向上した。
- CNNは慣性信号内の空間的パターンを効果的に捉えており、LSTMは歩行シーケンスの時間的ダイナミクスを優れた性能でモデル化している。
- ステップベースのデータセグメンテーションは、固定時間幅セグメンテーションよりもわずかに優れた性能を示した。
- 垂直方向にアライメントされた慣性データ(歩行サイクルに合わせたアライメント)は、水平方向アライメントよりも認証タスクで顕著に優れた性能を示した。
- ハイブリッドCNN-LSTMモデルは、単独のCNNまたはLSTMネットワークよりも顕著に優れた性能を示しており、空間的・時間的特徴の共同学習の有効性が裏付けられた。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。