[論文レビュー] Logic-Parametric Neuro-Symbolic NLI: Controlling Logical Formalisms for Verifiable LLM Reasoning
本論文は、論理を設定可能な設計要素として扱い、LogiKEy を用いて複数の論理を埋め込むことで検証可能な推論を改善する論理パラメトリックなニューロ-シンボリック NLI フレームワークを提案し、規範的説明のための新しい BENR データセットを導入する。
Large language models (LLMs) and theorem provers (TPs) can be effectively combined for verifiable natural language inference (NLI). However, existing approaches rely on a fixed logical formalism, a feature that limits robustness and adaptability. We propose a logic-parametric framework for neuro-symbolic NLI that treats the underlying logic not as a static background, but as a controllable component. Using the LogiKEy methodology, we embed a range of classical and non-classical formalisms into higher-order logic (HOL), enabling a systematic comparison of inference quality, explanation refinement, and proof behavior. We focus on normative reasoning, where the choice of logic has significant implications. In particular, we compare logic-external approaches, where normative requirements are encoded via axioms, with logic-internal approaches, where normative patterns emerge from the logic's built-in structure. Extensive experiments demonstrate that logic-internal strategies can consistently improve performance and produce more efficient hybrid proofs for NLI. In addition, we show that the effectiveness of a logic is domain-dependent, with first-order logic favouring commonsense reasoning, while deontic and modal logics excel in ethical domains. Our results highlight the value of making logic a first-class, parametric element in neuro-symbolic architectures for more robust, modular, and adaptable reasoning.
研究の動機と目的
- 規範的推論のためのニューロ-シンボリック NLI において、論理を制御可能な設計次元として扱う動機づけ。
- 古典論理と非古典論理を高階論理に埋め込み、推論、説明、証明挙動のモジュール的比較を可能にする。
- 論理内部推論と論理外推論のアプローチが堅牢性、効率性、説明品質に与える影響を調査する。
- NLI タスクにおける異なる論理の領域依存的な有効性について実証的証拠を提供する。
提案手法
- LogiKEy フレームワークの下で Faithful-Refiner 型 NL から formalization へを論理パラメトリックパイプラインへ拡張。
- 複数の論理(FOL、KD、DDLE、DDL_CJ)を意味的埋め込みを用いて Isabelle/HOL に埋め込む。
- 自動形式化、構文/整合性チェック、定理証明、反復的フィードバックによる説明の洗練の4段階パイプラインを使用。
- 内的規範構造を探るために生物倫理の規範的推論に焦点を当てた BENR データセットを構築。
- 2 つの大規模言語モデル(GPT-4o と DeepSeek-V1)を最大3回の洗練反復で論理ごとに評価。
実験結果
リサーチクエスチョン
- RQ1論理形式論法の選択が NLI のための LLM 主導定理証明にどのような影響を与えるか。
- RQ2論理内部推論戦略と論理外推論アプローチを比較できるか。
- RQ3論理パラメトリックアーキテクチャは証明の経済性、説明の洗練、検証性を改善できるか。
主な発見
- KD は GPT-4o にとって論理ごとでの説明成功率が最も高く(77.67%)、他論理より高い。
- KD は他の論理と比較して正当な説明に到達するまでの洗練ステップが少なくて済む傾向。
- 一階部分の論理(FOL)は構文的には堅牢だが、有効な説明の数が少なく、堅牢性と表現範囲の間のトレードオフを示す。
- 領域効果: FOL は常識的推論に有利であり、規範的・モーダル論理は倫理的・ norm 的領域で卓越。
- 論理内部アプローチ(例: DDL_CJ)は論理外アプローチと比べてより強い規範構造、より良い収束、推論コストの低減を実現。
- 論理の有効性は領域依存的で、異なる論理が実践的推論の異なる段階を優先する。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。