[論文レビュー] Transitive Expert Error and Routing Problems in Complex AI Systems
論文本体は Transitive Expert Error (TEE) を定義し、 domain-expert の境界が境界上の脆弱性を生み出し、AIシステムにおけるルーティングとカバレッジの障害を引き起こすことを示し、提案されたアーキテクチャ的介入を提示する。
Domain expertise enhances judgment within boundaries but creates systematic vulnerabilities specifically at borders. We term this Transitive Expert Error (TEE), distinct from Dunning-Kruger effects, requiring calibrated expertise as precondition. Mechanisms enabling reliable within-domain judgment become liabilities when structural similarity masks causal divergence. Two core mechanisms operate: structural similarity bias causes experts to overweight surface features (shared vocabulary, patterns, formal structure) while missing causal architecture differences; authority persistence maintains confidence across competence boundaries through social reinforcement and metacognitive failures (experts experience no subjective uncertainty as pattern recognition operates smoothly on familiar-seeming inputs.) These mechanism intensify under three conditions: shared vocabulary masking divergent processes, social pressure for immediate judgment, and delayed feedback. These findings extend to AI routing architectures (MoE systems, multi-model orchestration, tool-using agents, RAG systems) exhibiting routing-induced failures (wrong specialist selected) and coverage-induced failures (no appropriate specialist exists). Both produce a hallucination phenotype: confident, coherent, structurally plausible but causally incorrect outputs at domain boundaries. In human systems where mechanisms are cognitive black boxes; AI architectures make them explicit and addressable. We propose interventions: multi-expert activation with disagreement detection (router level), boundary-aware calibration (specialist level), and coverage gap detection (training level). TEE has detectable signatures (routing patterns, confidence-accuracy dissociations, domain-inappropriate content) enabling monitoring and mitigation. What remains intractable in human cognition becomes addressable through architectural design.
研究の動機と目的
- ドメイン専門知識の境界がAIシステムにおける体系的な脆弱性を生み出すメカニズムを同定する。
- TEE を推進する構造的類似性バイアスと権威の持続性を特徴づける。
- ルーティングアーキテクチャ(MoE、マルチモデルオーケストレーション、RAG)がルーティングおよびカバレージ障害をいかに示すかを説明する。
- TEE を検出・緩和するためのアーキテクチャ的およびトレーニングレベルの介入を提案する。
提案手法
- 本論文は、構造的類似性が因果的な分岐を覆い隠し、表面的特徴に過度に依存させる仕組みを分析する。
- 権威の持続性とメタ認知的失敗を、能力境界を超えた自信の持続性の推進要因として特定する。
- TEE をAIのルーティングアーキテクチャにマッピングし、ルーティング決定が不適切な専門家を選択したりカバレージが欠落する様子を説明する。
- disagreement検出を伴う多専門家活性化、境界を意識した較正、カバレージギャップ検出などの介入を提案する。
- ルーティングパターンや信頼-正確さの乖離といった検出可能な署名について論じる。
実験結果
リサーチクエスチョン
- RQ1AIシステムの domain boundary における Transitive Expert Error の根本的なメカニズムは何か。
- RQ2ルーティングアーキテクチャはエキスパートシステムのルーティング誘発・カバレージ誘発の障害にいかに寄与するか。
- RQ3ルーター、スペシャリスト、トレーニングレベルでTEEを緩和する介入には何があるか。
- RQ4TEE を示す検出可能な信号は何で、どのようにモニタリングできるか。
- RQ5人間の認知的ブラックボックスをAIで明示的に扱うよう設計上の工夫は可能か。
主な発見
- TEE は構造的類似性が分野横断の因果差を覆い隠し、権威の持続性が自信を維持させるときに生じる。
- 共有語彙とパターンが表面的特徴の過度な重視を引き起こし、誤った領域判断につながる。
- ルーティングアーキテクチャは誤ったスペシャリストを選択したりカバレージを欠くことで、境界で幻覚のような出力を生み出す。
- TEE にはルーティングパターンや信頼-正確さの乖離といった検出可能な署名がある。
- アーキテクチャ的介入は、複数専門家の disagreeing 検出、境界意識の較正、カバレージギャップ検出を通じてTEEを緩和できる。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。