Skip to main content
QUICK REVIEW

[论文解读] Financial Document Causality Detection Shared Task (FinCausal 2020)

Dominique Mariko, Hanna Abi Akl|arXiv (Cornell University)|Dec 4, 2020
Topic Modeling参考文献 10被引用 63
一句话总结

FinCausal 2020 引入了一个面向金融文档的因果关系检测的两任务共享任务,包含文本段落二元分类和因果-结果跨度提取轨道,并报告参赛系统及结果。

ABSTRACT

We present the FinCausal 2020 Shared Task on Causality Detection in Financial Documents and the associated FinCausal dataset, and discuss the participating systems and results. Two sub-tasks are proposed: a binary classification task (Task 1) and a relation extraction task (Task 2). A total of 16 teams submitted runs across the two Tasks and 13 of them contributed with a system description paper. This workshop is associated to the Joint Workshop on Financial Narrative Processing and MultiLing Financial Summarisation (FNP-FNS 2020), held at The 28th International Conference on Computational Linguistics (COLING'2020), Barcelona, Spain on September 12, 2020.

研究动机与目标

  • 为推进金融领域隐含性与多重因果检测,贡献一个公开可获取的 FinCausal 语料库。
  • 定义两个子任务(二元因果检测和因果-结果跨度提取)以评估系统。
  • 提供基线和排行榜以比较多样化建模方法。
  • 鼓励在金融领域因果检测方面的可重复性和代码、方法学的共享。

提出的方法

  • 定义以2019年金融新闻为基础的 FinCausal 语料库,具有 Cause、QFact、Fact、Discard/Remove 的注释方案。
  • 提出任务1:对包含因果性的文本段落进行二元分类。
  • 提出任务2:在因果性文本段落内提取 Cause 和 Effect 片段。
  • 提供基线系统和基于加权 F1、召回率和精确率的任务1评估协议,以及任务2的 Exact Match。
  • 在盲评估数据集上评估提交结果,并允许每个团队进行多次提交。

实验结果

研究问题

  • RQ1现代模型在不平衡数据下对金融文本段落中的因果关系(任务1)的检测效果如何?
  • RQ2序列标注模型(如 BERT-CRF)是否能够在因果段落内准确识别并定位 Cause 和 Effect 片段(任务2)?
  • RQ3基于 Transformer 的方法与传统机器学习方法的比较优势,以及集成和数据增强对任务性能的影响?

主要发现

  • 六支团队在任务1上取得了高于95%的顶级 F1 分数,LIORI 97.75%,UPB 97.55%,ProsperAMNet 97.23%。
  • 六支团队在任务1中使用了基于 Transformer 的架构并进行了微调,常与集成方法结合。
  • NTUNLP 使用 BERT-CRF 并采用 Viterbi 解码进行跨度优化, Task 2 加权 F1 最高为 94.72%。
  • GBe 使用 BERT-SQuAD 增强系统并结合跨度启发式,Task 2 加权 F1 为 94.66%。
  • 基线结果:任务1基线 95.23 F1,任务2基线 51.06 F1;参赛团队报告了基线后的改进。

更好的研究,从现在开始

从论文设计到论文写作,大幅缩短您的研究时间。

无需绑定信用卡

本解读由 AI 生成,并经人工编辑审核。