[論文レビュー] AI Hallucinations: A Misnomer Worth Clarifying
本論文は、14のデータベースにおけるAI幻覚の定義の体系的レビューを実施し、普遍的な定義が存在しないことを明らかにし、標準化された用語と分類体系を提案している。
As large language models continue to advance in Artificial Intelligence (AI), text generation systems have been shown to suffer from a problematic phenomenon termed often as "hallucination." However, with AI's increasing presence across various domains including medicine, concerns have arisen regarding the use of the term itself. In this study, we conducted a systematic review to identify papers defining "AI hallucination" across fourteen databases. We present and analyze definitions obtained across all databases, categorize them based on their applications, and extract key points within each category. Our results highlight a lack of consistency in how the term is used, but also help identify several alternative terms in the literature. We discuss implications of these and call for a more unified effort to bring consistency to an important contemporary AI issue that can affect multiple domains significantly.
研究の動機と目的
- 多様な分野とデータベース全体で「AI幻覚」という用語がどのように定義されているかを特定する。
- 定義の一貫性を評価し、共通の特徴と代替案を特定する。
- 定義を収集・分類して、AI生成コンテンツのエラーの統一用語に形成に資するよう、統一用語の形成に資するよう、定義を収集・分類する。
- 異分野での活用を前提とした正式な定義と堅牢な分類体系の指針を提供する。
提案手法
- 2013年から2023年までの期間、AI/LLMsにおけるAI幻覚を定義する論文を対象に、14のデータベースにわたる広範な文献検索を実施する。
- 各論文を手作業で精読し、定義と文脈を抽出する。
- 333個の定義を集約し、付録に要約する。
- 定義を適用ドメイン別に分類する(例:医療、法務、翻訳、要約など)。
- 代替語を特定し、用語標準化への影響を論じる。
実験結果
リサーチクエスチョン
- RQ1異なるドメインとデータベースにおいて、AI幻覚の定義にはどのようなものが存在するか。
- RQ2これらの定義はどれくらい一貫性があり、共通している特徴と乖離している点は何か。
- RQ3どのような代替語が使用されているか、また明確さを高めるために統一分類体系をどのように開発できるか。
主な発見
- 文献全体において、正確で普遍的に受け入れられた定義は存在しない。
- 定義は適用分野によって異なり、対立している場合や文脈依存であることがある。
- Table II および Table III は、領域を横断してAI幻覚を説明するために使用される代替語と主要ポイントを要約している。
- 著者らは2013年から2023年の333の定義を収集し、定義の全セットを付録に提供する。
- 近年の文献には、精神衛生上の含意やスティグマを避けるために用語を置換・改名する動きがある。
- 本論文は、分野横断的なコミュニケーションと研究を改善するための、統一された用語と堅牢な正式定義の提案を行っている。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。