[論文レビュー] Active inference body perception and action for humanoid robots
本論文は、視覚的および本体感覚的入力の予測と観測の間の予測誤差を最小化する自由エネルギー原理を用いて、実世界のヒューマノイドロボット(iCub)にアクティブインファレンスによる身体認識と行動モデルを初めて実装した。このモデルは、センサーノイズやモデルの不一致に対しても適応的で閉ループな到達行動およびヘッドトラッキングを可能にし、古典的逆運動学と比較して精度と耐障害性に優れながら、計算コストを低く維持している。
Providing artificial agents with the same computational models of biological systems is a way to understand how intelligent behaviours may emerge. We present an active inference body perception and action model working for the first time in a humanoid robot. The model relies on the free energy principle proposed for the brain, where both perception and action goal is to minimise the prediction error through gradient descent on the variational free energy bound. The body state (latent variable) is inferred by minimising the difference between the observed (visual and proprioceptive) sensor values and the predicted ones. Simultaneously, the action makes sensory data sampling to better correspond to the prediction made by the inner model. We formalised and implemented the algorithm on the iCub robot and tested in 2D and 3D visual spaces for online adaptation to visual changes, sensory noise and discrepancies between the model and the real robot. We also compared our approach with classical inverse kinematics in a reaching task, analysing the suitability of such a neuroscience-inspired approach for real-world interaction. The algorithm gave the robot adaptive body perception and upper body reaching with head object tracking (toddler-like), and was able to incorporate visual features online (in a closed-loop manner) without increasing the computational complexity. Moreover, our model predicted involuntary actions in the presence of sensorimotor conflicts showing the path for a potential proof of active inference in humans.
研究の動機と目的
- ヒューマノイドロボットにおけるリアルタイムな身体認識と行動のための神経科学にインspiredされたアクティブインファレンスフレームワークを実装すること。
- 理論的自由エネルギー原理と物理的ロボティクスの間のギャップを埋めるために、iCubロボット上でモデルを検証すること。
- センサーノイズやモデル-アクチュエータの不一致に対処しつつ、計算複雑性を低く保ちながら、低遅延の閉ループ感覚統合を実現すること。
- 実世界の到達タスクにおいて、アクティブインファレンス手法と古典的逆運動学を比較すること。
- アクティブインファレンスが、ラバーハンド錯覚のような感覚運動的相反状況で見られる不随伴的運動反応をモデル化する可能性を検討すること。
提案手法
- モデルは、観測されたと予測された感覚入力の間の予測誤差を低減することで、潜在的な身体状態(例:関節角)を推定するため、変分的自由エネルギー最小化を用いる。
- 感覚統合は、変分的自由エネルギーの境界に対する勾配降下法を用いて更新され、ベイジアン推論に類似した方法で視覚的および本体感覚的信号を統合する。
- 行動は、感覚の不確実性(サプライズ)を低減するための同じ自由エネルギー関数を最適化することで、予測誤差に対する反射的反応として生成される。
- アルゴリズムは、行動計算を簡略化し、リアルタイム性能を確保するため、速度制御と時間離散化されたフレームワークで実装されている。
- 感覚予測のための生成モデルは、前向き運動学から導出されており、計算負荷を増加させることなくオンラインで適応可能である。
- 自由エネルギーの和に新たな感覚項を追加することで、モalityに依存しない拡張が可能であり、柔軟な感覚統合を実現する。
実験結果
リサーチクエスチョン
- RQ1自由エネルギー原理に基づくアクティブインファレンスは、実世界のヒューマノイドロボットにおいて、頑健で適応的な身体認識と行動を可能にするか?
- RQ2ロボットのモデルと実際の身体ダイナミクスとの不一致や高レベルの感覚ノイズ下でも、このモデルは良好に動作するか?
- RQ3アクティブインファレンスフレームワークは、到達精度と適応性において、古典的逆運動学を上回る性能を示せるか?
- RQ4感覚運動的相反状況(例:ラバーハンド錯覚)において、モデルは不随伴的運動反応を予測できるか?
- RQ5計算複雑性を増加させることなく、閉ループでリアルタイムに新たな感覚特徴を統合できるか?
主な発見
- アクティブインファレンスモデルにより、iCubロボットは、リアルタイム条件下で2次元および3次元の視覚空間において、適応的上肢到達とヘッドオブジェクトトラッキングを実現した。
- 特にセンサーノイズやモデル不一致の下でも、古典的逆運動学と比較して高い到達精度を達成した。
- 閉ループで新たな視覚的特徴を統合しても、計算複雑性が一定に保たれた。
- 感覚運動的相反状況では、視覚的刺激に向かって不随伴的動きが観察され、ラバーハンド錯覚の予測と整合的であった。
- 予測誤差が最小化された際、ハンド-オブジェクト接触などの均衡点への収束が観察され、安定した目的指向的行動が示された。
- 自由エネルギー最適化により、内部モデルと実際の観測との乖離が著しく低減され、不確実性やモデルバイアスに対しても頑健であることが実証された。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。