QUICK REVIEW

[论文解读] Interpretable Charge Predictions for Criminal Cases: Learning to Generate Court Views from Fact Descriptions

Hai Ye, Xin Jiang|arXiv (Cornell University)|Feb 23, 2018

Artificial Intelligence in Law被引用 23

一句话总结

本文提出一种基于标签条件的序列到序列模型，并引入注意力机制，从刑事案情描述中生成可解释的法庭观点，提升对指控具有区分性的理由生成能力。通过将解码器基于指控标签进行条件化，模型学会生成突出显示与指控相关特性的理由，相较于基线序列到序列模型，在真实世界中文刑事案情数据集上实现了流畅性、准确性和可采纳性方面的显著提升。

ABSTRACT

In this paper, we propose to study the problem of COURT VIEW GENeration from the fact description in a criminal case. The task aims to improve the interpretability of charge prediction systems and help automatic legal document generation. We formulate this task as a text-to-text natural language generation (NLG) problem. Sequenceto-sequence model has achieved cutting-edge performances in many NLG tasks. However, due to the non-distinctions of fact descriptions, it is hard for Seq2Seq model to generate charge-discriminative court views. In this work, we explore charge labels to tackle this issue. We propose a label-conditioned Seq2Seq model with attention for this problem, to decode court views conditioned on encoded charge labels. Experimental results show the effectiveness of our method.

研究动机与目标

通过生成能够解释指控决定的推理过程，提升指控预测系统的可解释性。
解决在不同指控之间案情描述缺乏显著差异时，生成具有指控区分性的推理过程的挑战。
将法庭观点生成建模为使用真实法律文书的文本到文本自然语言生成（NLG）任务。
利用指控标签作为条件信号，引导生成反映特定指控法律推理的推理过程。
发布一个真实世界中文刑事案情数据集，包含案情描述、推理理由和指控标签，以供未来研究使用。

提出的方法

将法庭观点生成建模为文本到文本的NLG任务，输入为案情描述，输出为支持特定指控的推理理由。
提出一种基于标签条件的序列到序列模型并引入注意力机制，将指控标签嵌入并作为条件输入解码器，以引导生成过程。
使用编码器将案情描述编码为上下文向量，使用解码器基于上下文向量和编码后的指控标签生成推理理由。
引入注意力机制，使生成的词语与输入描述中的相关案情细节对齐。
使用占位符（如<name>、<num>、<date>）进行词级别掩码，并使用HanLP对中文文本进行分词。
使用Adam优化器进行训练，结合早停策略、学习率调度，并以困惑度作为更新指标。

实验结果

研究问题

RQ1基于指控标签条件化的序列到序列模型是否能比标准Seq2Seq模型生成更具指控区分性的推理理由？
RQ2指控标签在多大程度上提升了生成的法庭观点推理理由的流畅性和事实准确性？
RQ3该方法在多大程度上能生成适合真实法律场景使用的推理理由，经由人工标注者评估？
RQ4包含指控标签是否显著提升了生成推理理由与输入描述中关键事实细节之间的对齐程度？
RQ5与基线NLG模型相比，该模型在真实世界中文刑事案情数据集上的表现如何？

主要发现

所提出的基于标签条件的Seq2Seq模型在自动指标（BLEU-4和ROUGE分数）和人工评估方面均显著优于标准Seq2Seq基线模型。
人工标注者对生成的推理理由评分显示其流畅性高（平均分4.3/5），事实准确性也较高（平均分4.1/5）。
在100份生成的推理理由中，有87份被判定可直接用于真实法律场景，表明其具有强大的实际应用价值。
该模型在测试集上达到BLEU-4分数24.1和ROUGE-L分数32.6，证明其生成质量优异。
消融实验证实，基于指控标签的条件化显著提升了模型生成具有指控区分性的内容的能力，尤其在诸如故意杀人与过失杀人等相似指控之间表现更优。
模型有效学习到生成包含推断要素（如意图）的推理理由，即使这些要素在案情描述中未明确提及，从而增强了可解释性。

更好的研究，从现在开始

从论文设计到论文写作，大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成，并经人工编辑审核。