ACLJan, 2021

通过 Doc2Doc 信息检索实现合规性监管:在欧盟 / 英国立法中进行的案例研究,其中文本相似性具有限制

TL;DR该研究介绍了一种基于文档检索的监管信息检索新方法 REG-IR,该方法使用一个包含整个文档的查询,比传统的短查询更具挑战性。此外,研究人员通过 EU 指令和英国立法之间的关系编制并发布了两个数据集,并使用基于 BERT 模型的多个表示从 BM25 到 k 最近邻的各种预取器进行了实验,证明对 BERT 模型进行领域内微调是 IR 的最佳表示。实验表明,由于存在相反标签的相似查询 - 文档对的相互矛盾监督,神经网络重新排序器表现不佳。然而,实验进一步表明,应用日期过滤器可以进一步提高检索性能,突显时间维度的重要性。