[论文解读] Event Causality Extraction with Event Argument Correlations
本论文提出 DualCor,一种用于端到端事件因果提取(ECE)的双网格标注模型,能够捕获同一事件内外的参数相关性,从文本中提取结构化的因果事件对。
Event Causality Identification (ECI), which aims to detect whether a causality relation exists between two given textual events, is an important task for event causality understanding. However, the ECI task ignores crucial event structure and cause-effect causality component information, making it struggle for downstream applications. In this paper, we explore a novel task, namely Event Causality Extraction (ECE), aiming to extract the cause-effect event causality pairs with their structured event information from plain texts. The ECE task is more challenging since each event can contain multiple event arguments, posing fine-grained correlations between events to decide the causeeffect event pair. Hence, we propose a method with a dual grid tagging scheme to capture the intra- and inter-event argument correlations for ECE. Further, we devise a event type-enhanced model architecture to realize the dual grid tagging scheme. Experiments demonstrate the effectiveness of our method, and extensive analyses point out several future directions for ECE.
研究动机与目标
- 激发并界定一个新任务:事件因果提取(ECE),从纯文本中检索带有结构化事件信息的因果事件对。
- 通过纳入事件结构与显式因果成分,解决先前事件因果识别(ECI)的局限性。
- 提出一种双网格标注方案,用于建模 ECE 中的同事件内以及事件间参数相关性。
- 设计一个类型感知的编码器和一个端到端模型(DualCor),实现双网格标注以实现鲁棒的 ECE。
提出的方法
- 引入两个网格标注表(原因与结果),给定 m 种事件类型和 n 个令牌,其中每个条目包含一个将相关性、角色和边界字段组合在一起的标签。
- 使用双网格解码过程:参数跨度解码、事件结构解码和因果对解码。
- 应用一个类型感知编码器,将事件类型标记拼接在一起,并使用 BERT 获取令牌表示,随后通过带有 Conditional Layer Normalization(CLN)的网格表示层将事件类型信息融合到网格条目中。
- 在网格条目上对原因网格和结果网格进行多标签分类训练,结合两个网格的损失。
- 通过匹配最近端规则解码跨度,按类型聚合同事件内的参数,并通过互相关信号连接事件间参数,从而形成因果事件对。
实验结果
研究问题
- RQ1一种利用同事件内外参数相关性、双网格标注的方法,是否能改善带有结构化事件信息的因果事件对的端到端提取?
- RQ2通过类型感知编码器和 CLN 引入事件类型信息,是否比单一网格或以实体为中心的基线在参数预测上有改进?
- RQ3如何对事件间相关性建模,以帮助正确匹配因果事件并减少冗余或错误分配的参数?
主要发现
| Model | EAE_P | EAE_R | EAE_F1 | CET_P | CET_R | CET_F1 | ECE_P | ECE_R | ECE_F1 |
|---|---|---|---|---|---|---|---|---|---|
| BERT-softmax+Causality | 32.55 | 35.11 | 33.78 | 49.61 | 64.20 | 55.97 | 30.47 | 31.52 | 30.99 |
| BERT-CRF+Causality | 35.52 | 34.10 | 34.79 | 53.22 | 60.95 | 56.82 | 31.02 | 31.28 | 31.15 |
| DMBERT+Causality | 34.27 | 38.18 | 36.12 | 52.87 | 63.20 | 57.58 | 30.08 | 34.93 | 32.33 |
| PLMEE+Causality | 34.22 | 40.70 | 37.18 | 58.11 | 60.20 | 59.13 | 29.98 | 41.14 | 34.69 |
| Novel-tagging | 59.40 | 28.47 | 38.49 | 49.79 | 61.70 | 55.11 | 51.52 | 26.75 | 35.22 |
| CasECE | 36.88 | 36.72 | 36.80 | 58.26 | 59.70 | 58.97 | 31.30 | 41.81 | 35.80 |
| Pair-tagging | 47.08 | 46.49 | 46.79 | 55.78 | 62.95 | 59.14 | 39.24 | 47.69 | 43.05 |
| DualCor | 58.05 | 47.60 | 52.31 | 61.75 | 58.19 | 59.92 | 48.56 | 44.85 | 46.63 |
- DualCor 在 EAE、CET 和 ECE 指标的基线比较中实现了最佳总体结果。
- 消融研究表明,同事件内相关性、事件间相关性以及类型感知编码均对性能有显著贡献。
- 在所评估的数据集上,DualCor 在 EAE 和 CET 上取得改进,但 ECE 性能仍具有挑战性,尤其是对包含多个因果对的句子。
- 相比 Pair-Linking,DualCor 在训练和推断上具备效率优势,同时保持具有竞争力的准确性。
- 错误分析显示常见失败包括错误的因果类型预测、冗余的参数以及缺失的参数,指向未来改进的方向。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。