[论文解读] Financial Document Causality Detection Shared Task (FinCausal 2020)
FinCausal 2020 引入了一个面向金融文档的因果关系检测的两任务共享任务,包含文本段落二元分类和因果-结果跨度提取轨道,并报告参赛系统及结果。
We present the FinCausal 2020 Shared Task on Causality Detection in Financial Documents and the associated FinCausal dataset, and discuss the participating systems and results. Two sub-tasks are proposed: a binary classification task (Task 1) and a relation extraction task (Task 2). A total of 16 teams submitted runs across the two Tasks and 13 of them contributed with a system description paper. This workshop is associated to the Joint Workshop on Financial Narrative Processing and MultiLing Financial Summarisation (FNP-FNS 2020), held at The 28th International Conference on Computational Linguistics (COLING'2020), Barcelona, Spain on September 12, 2020.
研究动机与目标
- 为推进金融领域隐含性与多重因果检测,贡献一个公开可获取的 FinCausal 语料库。
- 定义两个子任务(二元因果检测和因果-结果跨度提取)以评估系统。
- 提供基线和排行榜以比较多样化建模方法。
- 鼓励在金融领域因果检测方面的可重复性和代码、方法学的共享。
提出的方法
- 定义以2019年金融新闻为基础的 FinCausal 语料库,具有 Cause、QFact、Fact、Discard/Remove 的注释方案。
- 提出任务1:对包含因果性的文本段落进行二元分类。
- 提出任务2:在因果性文本段落内提取 Cause 和 Effect 片段。
- 提供基线系统和基于加权 F1、召回率和精确率的任务1评估协议,以及任务2的 Exact Match。
- 在盲评估数据集上评估提交结果,并允许每个团队进行多次提交。
实验结果
研究问题
- RQ1现代模型在不平衡数据下对金融文本段落中的因果关系(任务1)的检测效果如何?
- RQ2序列标注模型(如 BERT-CRF)是否能够在因果段落内准确识别并定位 Cause 和 Effect 片段(任务2)?
- RQ3基于 Transformer 的方法与传统机器学习方法的比较优势,以及集成和数据增强对任务性能的影响?
主要发现
- 六支团队在任务1上取得了高于95%的顶级 F1 分数,LIORI 97.75%,UPB 97.55%,ProsperAMNet 97.23%。
- 六支团队在任务1中使用了基于 Transformer 的架构并进行了微调,常与集成方法结合。
- NTUNLP 使用 BERT-CRF 并采用 Viterbi 解码进行跨度优化, Task 2 加权 F1 最高为 94.72%。
- GBe 使用 BERT-SQuAD 增强系统并结合跨度启发式,Task 2 加权 F1 为 94.66%。
- 基线结果:任务1基线 95.23 F1,任务2基线 51.06 F1;参赛团队报告了基线后的改进。
更好的研究,从现在开始
从论文设计到论文写作,大幅缩短您的研究时间。
无需绑定信用卡
本解读由 AI 生成,并经人工编辑审核。