[论文解读] PPCR-IM: A System for Multi-layer DAG-based Public Policy Consequence Reasoning and Social Indicator Mapping
PPCR-IM 构建政策后果的多层 DAG,映射到固定的指示性词汇并给出定性方向,对覆盖与发现性进行评估,在政府聚焦下 outperform 于两个 LLM 基线,覆盖 1,027 个政策情景。
Public policy decisions are typically justified using a narrow set of headline indicators, leaving many downstream social impacts unstructured and difficult to compare across policies. We propose PPCR-IM, a system for multi-layer DAG-based consequence reasoning and social indicator mapping that addresses this gap. Given a policy description and its context, PPCR-IM uses an LLM-driven, layer-wise generator to construct a directed acyclic graph of intermediate consequences, allowing child nodes to have multiple parents to capture joint influences. A mapping module then aligns these nodes to a fixed indicator set and assigns one of three qualitative impact directions: increase, decrease, or ambiguous change. For each policy episode, the system outputs a structured record containing the DAG, indicator mappings, and three evaluation measures: an expected-indicator coverage score, a discovery rate for overlooked but relevant indicators, and a relative focus ratio comparing the systems coverage to that of the government. PPCR-IM is available both as an online demo and as a configurable XLSX-to-JSON batch pipeline.
研究动机与目标
- 将定性政策后果推理外化并结构化为多层 DAG。
- 将 DAG 节点映射到固定的社会指标集合,并给出定性影响方向。
- 提供评估指标覆盖度、被忽略指标的发现率,以及系统与政府聚焦的对比。
- 提供交互式演示和用于政策分析师与 NLP 研究人员的 XLSX-to-JSON 批量流水线。
提出的方法
- 由 LLM 驱动的按层级的 DAG 生成,用以建模具有多父节点的政策后果路径。
- 将 DAG 构造与指标映射分离,使后果与固定指示性词汇表对齐。
- 对每个指标,查询模型以确定可能受影响的指标并分配方向(增加、减少、模糊),并给出支持节点。
- 计算评估指标:期望指标覆盖、被忽略指标发现率,以及跨情景的模型–政府聚焦比。
- 提供在线演示和开源的 XLSX-to-JSON 批量流水线以提高可重复性。
实验结果
研究问题
- RQ1层级化、基于 DAG 的推理方法是否能改进政策后果与固定社会指标集合的一致性?
- RQ2将中间后果映射到共享指标词汇是否能捕捉到超出政府聚焦的更广或替代影响?
- RQ3所提的评估指标是否能反映与政府聚焦的一致性及对被忽略但相关指标的发现?
主要发现
| 系统 | 指标 | 均值 | 标准差 | 最小值 | 最大值 |
|---|---|---|---|---|---|
| GPT 5.1 | 期望指标覆盖分数 | 0.851 | 0.052 | 0.68 | 0.94 |
| GPT 5.1 | 被忽略指标发现率 | 0.352 | 0.088 | 0.15 | 0.58 |
| GPT 5.1 | 模型–政府聚焦比 | 1.098 | 0.115 | 0.86 | 1.41 |
| Doubao | 期望指标覆盖分数 | 0.803 | 0.061 | 0.62 | 0.91 |
| Doubao | 被忽略指标发现率 | 0.291 | 0.079 | 0.12 | 0.51 |
| Doubao | 模型–政府聚焦比 | 1.023 | 0.108 | 0.81 | 1.33 |
| PPCR-IM | 期望指标覆盖分数 | 0.902 | 0.048 | 0.71 | 0.96 |
| PPCR-IM | 被忽略指标发现率 | 0.603 | 0.092 | 0.18 | 0.67 |
| PPCR-IM | 模型–政府聚焦比 | 1.356 | 0.124 | 0.89 | 1.52 |
- PPCR-IM 的平均期望指标覆盖分数为 0.902(标准差 0.048)。
- PPCR-IM 的被忽略指标发现率为 0.603(标准差 0.092)。
- PPCR-IM 的模型–政府聚焦比为 1.356(标准差 0.124)。
- 在 1,027 个政策情景中,PPCR-IM 对所有三个指标均优于两个 LLM 基线(GPT 5.1 与 Doubao)。
- DAG 表征使得能够追踪通过中间机制产生额外指标的路径,而不仅限于直接的政府聚焦。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。