基于上下文的引文建议
本论文提出了一种基于相关性的新闻专家选择任务,通过构建一个包括 24,031 对引语 - 发言人的新闻引文数据集,采用基于 BERT 的问答模型对其进行自动抽取,然后通过文件检索任务鉴定信任专家。实验证明,与专家检索相比,文件检索可以更有效地识别与特定新闻主题相关的专家。
May, 2023
本文提出一种基于深度学习的模型和完整组织的数据集,用于文章引用建议的上下文感知。该模型具有文档编码器和上下文编码器,并使用图卷积网络层和来自转换器的双向编码器表示 (BERT)。修改了 PeerRead 数据集之后,提出新的数据集全文 PeerRead,其中包含指向引用和文章元数据的上下文句子取样。本文中所述的方法能够获得最新的预测结果,提高了 28% 以上的平均准确率 (MAP) 和 recall@k。
Mar, 2019
该研究构建了一个大型的全开放式的引语推荐数据集 QuoteR,并对现有的引语推荐方法进行了全面的评估。此外,他们提出了一种新的引语推荐模型,在所有三个部分的 QuoteR 上均显著优于以前的方法。
Feb, 2022
论文研究了使用神经网络和预训练语言模型来提取文件中问题的答案,通过提供丰富的上下文表示并允许模型在上下文相关和上下文无关的单词表示之间进行选择,可以获得比现有技术更好的性能。
Dec, 2017
本论文提供了一种使用 BERT 模型选择相关文档块进行扩展的新型查询扩展模型,能够在标准 TREC Robust04 测试集上显著优于 BERT-Large 模型,有助于解决查询扩展方法引入不相关信息的问题。
Sep, 2020
本研究探讨了在线对话中自动引用生成的一些特点,基于对话历史、语言一致性的相互作用,以及与查询转的现有内容的一致性等方面对引文的语境一致性进行了捕捉,并采用编码 - 解码神经框架通过语言生成来继续语境,实现引文的自动化。通过英文和中文两个大规模数据集进行实验,结果表明我们的引文生成模型优于现有的最先进模型。进一步的分析显示,主题、交互和查询的一致性都有助于学习如何在在线对话中引用。
Jun, 2021
该研究提出了一种基于内容的方法来推荐论文草稿中的引用,通过将请求文档嵌入到向量空间中,再使用其最近邻作为候选项,并使用区分观察和未观察到的引用的判别模型对候选项进行重新排序,无需元数据,得到了相对于标准数据集的显著提升。
Feb, 2018