Sep, 2023

引文文本生成之引文部分识别

TL;DR基于引用文献的自动相关工作生成应当将输出结果与引用论文的内容相关联,以避免虚构产生了,然而由于科学文献的篇幅限制,现有的抽象方法只依赖于引用论文的摘要。我们证明了摘要并不总是产生引文时最适合的输入,这样训练出来的模型会出现虚构结果。相反,我们提出使用引用文本片段作为替代输入。由于手动标注引文文本片段非常耗时耗力,我们尝试了基于 ROUGE 的候选引文文本片段标注,并取得了足够强的性能,可以代替昂贵的人工标注,并提出了基于关键词的引文文本片段检索方法,使得生成以引用论文的全文为基础的引文文本成为可能也变得实际可行。