QUICK REVIEW

[論文レビュー] Virtual Embodiment: A Scalable Long-Term Strategy for Artificial Intelligence Research

Douwe Kiela, Luana Bulat|arXiv (Cornell University)|Oct 24, 2016

Multimodal Machine Learning Applications参考文献 23被引用数 25

ひとこと要約

本稿では、特に目的を持つビデオゲームを活用した仮想的身体化（virtual embodiment）を、人工知能の発展を促進するスケーラブルで倫理的に適切な長期戦略として提案している。特に、マルチモーダルでインタラクティブかつ段階的な学習を通じて人間水準の意味的理解に到達することを目的としている。人工エージェントが仮想的な感覚運動的経験を通じて言語や世界知識を学べる仕組みを提供することで、物理的制約や倫理的リスクなしに人工汎用知能への段階的発展を支援する。

ABSTRACT

Meaning has been called the "holy grail" of a variety of scientific disciplines, ranging from linguistics to philosophy, psychology and the neurosciences. The field of Artifical Intelligence (AI) is very much a part of that list: the development of sophisticated natural language semantics is a sine qua non for achieving a level of intelligence comparable to humans. Embodiment theories in cognitive science hold that human semantic representation depends on sensori-motor experience; the abundant evidence that human meaning representation is grounded in the perception of physical reality leads to the conclusion that meaning must depend on a fusion of multiple (perceptual) modalities. Despite this, AI research in general, and its subdisciplines such as computational linguistics and computer vision in particular, have focused primarily on tasks that involve a single modality. Here, we propose virtual embodiment as an alternative, long-term strategy for AI research that is multi-modal in nature and that allows for the kind of scalability required to develop the field coherently and incrementally, in an ethically responsible fashion.

研究の動機と目的

認知科学における身体化理論が求めるように、自然言語の意味的意味付けを物理的経験に根ざすという長年の課題に取り組む。
人間の意味的理解が持つマルチモーダル性、インタラクティブ性、時間的特性を捉えられていない現在の単一モーダルなAI研究の限界を克服する。
エージェントの能力に応じて複雑性を段階的に高める、長期的でスケーラブルな人工汎用知能への研究パスを構築する。
現実世界の結果が生じない安全な環境を提供し、AIの行動や倫理的意思決定のテストを実施可能にする。
人工エージェントが仮想世界との相互作用を通じて、他のエージェントや人間との通信・協働を学べる環境を実現する。

提案手法

人工エージェントが身体的・マルチモーダルでインタラクティブな経験を通じて意味を学べるプラットフォームとして、目的を持つビデオゲーム（特に「目的を持つビデオゲーム」）を仮想世界として活用する。
基本的な知覚から、複数の目的を持ち、非決定的戦略的計画に至るまで、段階的に複雑性を高めるための階層的フレームワーク（タイプ0からタイプ5）を実装する。
人間がわずかに優位な立場を取ることで、意味のある人間-AI協働を実現する、人工エージェントと人間の間の相互作用を促進する。
視覚的・聴覚的など、時間的・順序的・マルチモーダルな入力をサポートする仮想環境を設計し、現実世界の知覚と言語使用を模倣する。
深層強化学習とマルチエージェントシステムを活用し、エージェント同士が互いに学び合い、人間の模倣行動からも学習できるようにする。
エージェント行動を制御可能で非決定的な仮想環境に閉じ込めることで、現実世界のリスクを模倣しながら物理的被害を伴わない倫理的テストを可能にする。

実験結果

リサーチクエスチョン

RQ1人工エージェントは、仮想環境における身体的・マルチモーダルでインタラクティブな経験を通じて、どのように人間水準の意味的理解を達成できるか？
RQ2人工エージェントの認知的・言語的能力を段階的に高めるために、どの程度の身体化の階層的レベルが必要か？
RQ3物理的身體化と比較して、仮想身體化はAI開発のスケーラビリティ、段階的進行性、倫理的妥当性をどの程度高めるか？
RQ4人工エージェントは、仮想環境および他のエージェント（人間を含む）との相互作用を通じて、どのように言語や世界知識を学べるか？
RQ5仮想身體化のAI研究プラットフォームとして効果的であるための、ビデオゲームに必要な設計原則は何か？

主な発見

仮想身體化により、人工エージェントはマルチモーダルでインタラクティブかつ時間的構造を持つ経験を通じて意味を学べるようになり、単一モーダルで非インタラクティブなモデルの限界を克服できる。
提案されたタイプ0からタイプ5までの身體化の階層的フレームワークは、仮想環境とエージェント能力の複雑性を段階的に高めるためのスケーラブルな枠組みを提供する。
仮想環境では、エージェント同士が互いに学び合うことで、継続的な人間の監視が不要な迅速で反復的なAIシステム開発が可能になる。
現在のAI研究は、主にタイプ1の身體化にとどまっているため、より高度な複数目的および戦略的相互作用へ向かう進展の大きなギャップが存在する。
現時点で、タイプ5の身體化を満たす条件を満たすビデオゲームは存在しない。これは、主要な研究開発の機会を示している。
仮想身體化は、現実世界のリスクを伴わず、AI行動、特に倫理的意思決定のテストに適した安全で倫理的に適切なプラットフォームを提供する。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。