QUICK REVIEW

[論文レビュー] Interpretable Charge Predictions for Criminal Cases: Learning to Generate Court Views from Fact Descriptions

Hai Ye, Xin Jiang|arXiv (Cornell University)|Feb 23, 2018

Artificial Intelligence in Law被引用数 23

ひとこと要約

本稿では、犯罪事件の事実記述から解釈可能な裁判所の見解を生成するためのラベル条件付きシーケンス・ツー・シーケンスモデルを提案する。アテンション機構を備え、処罰の種別に特化した差異を強調する根拠を生成することで、実世界の中国語犯罪事件データセットにおいて、ベースラインのSeq2Seqモデルと比較して、自然さ、正確性、実用性の面で顕著な向上を達成した。

ABSTRACT

In this paper, we propose to study the problem of COURT VIEW GENeration from the fact description in a criminal case. The task aims to improve the interpretability of charge prediction systems and help automatic legal document generation. We formulate this task as a text-to-text natural language generation (NLG) problem. Sequenceto-sequence model has achieved cutting-edge performances in many NLG tasks. However, due to the non-distinctions of fact descriptions, it is hard for Seq2Seq model to generate charge-discriminative court views. In this work, we explore charge labels to tackle this issue. We propose a label-conditioned Seq2Seq model with attention for this problem, to decode court views conditioned on encoded charge labels. Experimental results show the effectiveness of our method.

研究の動機と目的

処罰決定を正当化する根拠を生成することで、処罰予測システムの解釈可能性を向上させること。
異なる処罰種別において事実記述が明確に区別されない状況において、処罰に特化した根拠を生成する課題に対処すること。
実世界の法的文書を用いて、裁判所の見解生成をテキスト・ツー・テキストの自然言語生成（NLG）タスクとして定式化すること。
処罰ラベルを条件付け信号として活用し、処罰に特化した法的推論を反映する根拠の生成をガイドすること。
今後の研究のため、事実記述、根拠、処罰ラベルを含む実世界の中国語犯罪事件データセットを公開すること。

提案手法

裁判所の見解生成をテキスト・ツー・テキストのNLGタスクとして定式化し、入力は事実記述、出力は特定の処罰を支持する根拠である。
処罰ラベルをエンベッドし、デコーダーに条件付けするアテンション機構を備えたラベル条件付きシーケンス・ツー・シーケンスモデルを提案する。
エンコーダーで事実記述をコンテキストベクトルに符号化し、デコーダーでコンテキストベクトルとエンコードされた処罰ラベルの両方に条件付けられた根拠を生成する。
生成された語句が入力記述内の関連する事実の詳細とアライメントするように、アテンション機構を統合する。
置換プレースホルダー（例：`<name>`、`<num>`、`<date>`）を用いた単語レベルのマスキングを実施し、中国語テキストをHanLPでトークン化する。
Adam最適化アルゴリズムを用い、早期停止、学習率スケジューリング、パープレクシティを更新指標として用いてモデルを訓練する。

実験結果

リサーチクエスチョン

RQ1処罰ラベルに条件付けられたシーケンス・ツー・シーケンスモデルは、標準的なSeq2Seqモデルと比較して、より処罰に特化した根拠を生成できるか？
RQ2処罰ラベルの導入が、生成された裁判所の見解の自然さと事実的正確性をどの程度向上させるか？
RQ3人間のアノテーターによる評価において、生成された根拠が実際の法的利用に適していると判断されるか？
RQ4処罰ラベルの導入により、生成された根拠と入力記述内の重要な事実の詳細との間の整合性が向上するか？
RQ5本モデルは、標準的なNLGモデルと比較して、実世界の中国語犯罪事件データセットにおいてどの程度の性能を示すか？

主な発見

提案されたラベル条件付きSeq2Seqモデルは、自動評価指標（BLEU-4とROUGEスコア）および人間評価の両面で、標準的なSeq2Seqベースラインを顕著に上回った。
人間のアノテーターは、生成された根拠を平均5段階中4.3の高い自然さ、平均5段階中4.1の高い事実的正確性と評価した。
全100件の生成された根拠のうち87件が、実際の法的利用に適していると判断され、強力な実用的価値を示した。
テストセットでは、BLEU-4スコアが24.1、ROUGE-Lスコアが32.6を達成し、優れた生成品質を示した。
アブレーションスタディの結果、処罰ラベルに条件付けすることで、特に故意殺人と過失殺人のような類似した処罰種別において、処罰に特化した内容の生成能力が顕著に向上した。
モデルは、事実記述に明示的に記載されていない要素（例：意思）を推論して含む根拠を効果的に生成でき、解釈可能性が向上した。

より良い研究を、今すぐ始めましょう

論文設計から論文執筆まで、研究時間を劇的に削減しましょう。

クレジットカード登録不要

このレビューはAIが作成し、人間の編集者が確認しました。