[論文レビュー] Generative AI vs. AGI: The Cognitive Strengths and Weaknesses of Modern LLMs
本論文は、現代の対話型 LLMs の認知的長所と短所を分析し、それらを人間レベルの AGI と比較し、建築的ギャップと人間可能な AGI へ向かう道筋を論じる。
A moderately detailed consideration of interactive LLMs as cognitive systems is given, focusing on LLMs circa mid-2023 such as ChatGPT, GPT-4, Bard, Llama, etc.. Cognitive strengths of these systems are reviewed, and then careful attention is paid to the substantial differences between the sort of cognitive system these LLMs are, and the sort of cognitive systems human beings are. It is found that many of the practical weaknesses of these AI systems can be tied specifically to lacks in the basic cognitive architectures according to which these systems are built. It is argued that incremental improvement of such LLMs is not a viable approach to working toward human-level AGI, in practical terms given realizable amounts of compute resources. This does not imply there is nothing to learn about human-level AGI from studying and experimenting with LLMs, nor that LLMs cannot form significant parts of human-level AGI architectures that also incorporate other ideas. Social and ethical matters regarding LLMs are very briefly touched from this perspective, which implies that while care should be taken regarding misinformation and other issues, and economic upheavals will need their own social remedies based on their unpredictable course as with any powerfully impactful technology, overall the sort of policy needed as regards modern LLMs is quite different than would be the case if a more credible approximation to human-level AGI were at hand.
研究の動機と目的
- 現実世界での利用における contemporary interactive LLMs (CILLMs) の認知的長所を評価する。
- CILLMs と人間全般知能との間の基本的な建築的ギャップを特定する。
- 実行可能な計算資源内で、LLMs の段階的な改善が現実的な人間レベルの AGI を達成する可能性が低い理由を説明する。
- LLM の文脈における狭義/閉じた範囲の AI と人間が可能な AGI を区別する。
- LLMs に関連する社会的・倫理的配慮と政策への影響を論じる。
提案手法
- LLM の能力と AGI の概念に関する多様な文献をレビューして統合的な見解を導く。
- 標準的な心のモデルと認知サイクルの概念を用いて、CILLMs を HCAGI と対比する。
- 一般知能への五つの概念的アプローチを統合する(実用的、心理学的、数学的、適応主義、システム論的)。
- 現在の AGI 分野のサブカテゴリー( universal, symbolic, emergentist, hybrid)を特徴づけ、LLM の長所/短所に対応づける。
- 建築の拡張とLLMsをより広い AGI システムに統合することの意味を論じる。
実験結果
リサーチクエスチョン
- RQ1現在の generative LLMs が示す認知的長所は何で、どこが不十分か?
- RQ2CILLMs は建築と学習能力の点で人間が可能な AGI とどのように異なるか?
- RQ3現実的な計算資源制約を考慮した場合、LLM アーキテクチャの段階的改善は HCAGI へのギャップを埋められるか?
- RQ4象徴ツールとハイブリッド・アーキテクチャは、LLMs を用いて HCAGI に近づく際にどんな役割を果たすか?
- RQ5現代の LLMs の展開と真の HCAGI との比較から生じる社会的・倫理的配慮は何か?
主な発見
- LLMs は驚くほど有能な常識的倫理推論を示すが、幻覚(ハルシネーション)とシンボルの基底づけの弱さに悩まされる。
- 人間の認知と比較して、世界モデル化、心の理論、複数段階の推論能力が制限されている。
- 現在の LLM アーキテクチャは、HCAGI に必要なオープンエンドで自己超越的な知性には不十分である。
- HCAGI への進展には、段階的な LLM の改善だけに頼るよりも、LLMs をより広いアーキテクチャへ統合することが必要である可能性が高い。
- 本論文は HCAGI と HLAGI を区別し、後者は全領域で実用的な人間レベルの能力を満たすには不十分である可能性を主張する。
- LLMs の社会的・政策的配慮は、仮想的な人間レベル AGI とは異なるリスクプロファイルを考えると異なる。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。