[論文レビュー] CVPD at QIAS 2026: RAG-Guided LLM Reasoning for Al-Mawarith Share Computation and Heir Allocation
この論文は、イスラム相続推論のための取り出し拡張・スキーマ制約パイプラインを提示し、0.935 MIR-Eを達成し、QIAS 2026 blind-testのランキングで1位を獲得した。
Islamic inheritance (Ilm al-Mawarith) is a multi-stage legal reasoning task requiring the identification of eligible heirs, resolution of blocking rules (hajb), assignment of fixed and residual shares, handling of adjustments such as awl and radd, and generation of a consistent final distribution. The task is further complicated by variations across legal schools and civil-law codifications, requiring models to operate under explicit legal configurations. We present a retrieval-augmented generation (RAG) pipeline for this setting, combining rule-grounded synthetic data generation, hybrid retrieval (dense and BM25) with cross-encoder reranking, and schema-constrained output validation. A symbolic inheritance calculator is used to generate a large high-quality synthetic corpus with full intermediate reasoning traces, ensuring legal and numerical consistency. The proposed system achieves a MIR-E score of 0.935 and ranks first on the official QIAS 2026 blind-test leaderboard. Results demonstrate that retrieval-grounded, schema-aware generation significantly improves reliability in high-precision Arabic legal reasoning tasks.
研究の動機と目的
- マドハーブおよび民法コード全体にわたる正確で多段階のイスラム相続推論を動機づける。
- 完全な中間推論 traces を提供するルールに基づく合成データ生成器を開発する。
- 決定論的検証を伴う、取り出し拡張・スキーマ制約付き生成パイプラインを構築する。
- 正確性と堅牢性を各段階で評価するため、QIAS 2026ベンチマークでパイプラインを評価する。
提案手法
- 決定論的ルールベース生成器と記号的相続計算機が、全段階の推論 traces を含む合成ケースを生成する。
- クロスエンコーダ再ランキングを用いたハイブリッドリトリーバ(dense + BM25)が、文脈として適切な解決ケースを選択する。
- 構造化出力とダウンストリーム検証を伴う制約付きLLMデコードが、鍵、型、ラベル、質量整合性を強制する。
- PDFで編纂された証拠を主要なリトリーババックボーンとし、リトリーバ証拠をアラビア語プロンプトに注入して思考分解と最終回答を行う。
- 生成後のパースと多段階検証により、スキーマ準拠と非-criticalフィールドの欠落時のフォールバックを保証する。

実験結果
リサーチクエスチョン
- RQ1取り出し根拠付き・スキーマ認識パイプラインは、高精度のアラビア語イスラム相続タスクに対してエンドツーエンドのLLM手法を上回ることができるか。
- RQ2合成・ルール基盤の監督が多段階推論と数値精度にどのように影響するか。
- RQ3リトリーバ元(PDF対Web)による意味品質と最終的なMIR-E性能に及ぼす影響は。
- RQ4下流検証はMIR-E評価下で正しい構造出力をどの程度保証できるか。
主な発見
| Rank | Team | MIR-E |
|---|---|---|
| 1 | CVPD (ours) | 0.935 |
| 2 | Simplicity Almansour (2026) | 0.931 |
| 3 | KMS Alkhamis (2026) | 0.916 |
| 4 | QU-NLP * | 0.907 |
| 5 | PSL Mouhoub (2026) | 0.898 |
| 6 | grkurdi * | 0.826 |
| 7 | UTLM * | 0.742 |
| 8 | rouba1234 * | 0.325 |
- パイプラインはMIR-E 0.935を達成し、QIAS 2026 blind-testの1位にランクされた。
- 市販のQwen 3.5 9B はオープンモデルの中で最も強力な初期推論を提供するが、出力の構造検証が必要。
- PDFのみのリトリーバルは意味品質と取得成功率でPDF+WebおよびWebのみを上回る(PDFのみ:190/200の高品質取得)。
- リトリーバ grounded・スキーマ制約付き生成は、従来のリトリーバ promptingやファインチューニング手法に比べて信頼性と安定性を向上させた。
- 残差エラーは主にブロック論理、分数計算、そして“awl handling”における端的なケースで集中している(アラビア語理解の問題ではない)。
- 厳選されたPDF法理証拠は、ウェブソースより高精度な法的推論に有利。
より良い研究を、今すぐ始めましょう
論文設計から論文執筆まで、研究時間を劇的に削減しましょう。
クレジットカード登録不要
このレビューはAIが作成し、人間の編集者が確認しました。