May, 2022

基于查询的长文档关键词提取

TL;DR文章讨论了在自然语言处理中,基于 Transformer 的架构会有输入大小的限制问题,但该论文通过将长文档分块并保持全局上下文,以查询定义话题,从而克服了这个问题,开发的系统使用预训练的 BERT 模型并调整它来估计给定文本跨度形成关键短语的概率,实验结果表明,在长文档上,使用查询的较短上下文大小胜过没有查询的较长上下文。