Jan, 2024

文档理财问答:一个长文本金融推理数据集

TL;DR在金融领域的定量推理研究中,由于商业和金融决策的重大影响,确实需要使用现实任务和数据。我们引入了一项长文档金融问答任务,通过在现有的 FinQA 数据集中添加完整文档的背景,将每个问题的平均上下文长度从 FinQA 的 700 个单词扩展到 DocFinQA 的 123k 个单词。我们对增强数据进行了广泛的基于检索的问答流程和长上下文语言模型的实验。结果表明,对于最强大的最先进系统来说,DocFinQA 提供了挑战。