提出一种对引文文本生成任务的简单修改方法,将生成目标扩展到整个上下文窗口,包括目标引文,实验结果表明,这种训练方式受到人类读者的青睐,并使生成模型能够利用关于讨论主题和立场的上下文线索。
Feb, 2024
基于引用文献的自动相关工作生成应当将输出结果与引用论文的内容相关联,以避免虚构产生了,然而由于科学文献的篇幅限制,现有的抽象方法只依赖于引用论文的摘要。我们证明了摘要并不总是产生引文时最适合的输入,这样训练出来的模型会出现虚构结果。相反,我们提出使用引用文本片段作为替代输入。由于手动标注引文文本片段非常耗时耗力,我们尝试了基于 ROUGE 的候选引文文本片段标注,并取得了足够强的性能,可以代替昂贵的人工标注,并提出了基于关键词的引文文本片段检索方法,使得生成以引用论文的全文为基础的引文文本成为可能也变得实际可行。
Sep, 2023
我们在这篇论文中探讨了最近显示对于生成的文本的逼真性、基础性和可控性有所改进的计划型模型的归因能力,该模型将计划概念化为一系列问题,旨在作为生成内容及其组织的蓝图。我们提出了两个利用不同蓝图变体的归因模型,一个是从头开始生成问题的抽象模型,另一个是从输入中复制问题的抽取模型。在长文问题回答的实验中,规划始终能够提高归因质量,此外,蓝图模型生成的引用文献与缺乏规划组件的基于 LLM 的流程获得的引用相比更加准确。
Apr, 2024
本文旨在通过学习简化的语义分离潜在表示来生成和控制自然语言句子,同时通过变分自编码器和全局属性判别器的组合来建立新的神经生成模型。该模型具有可解释性和高效性,可以生成符合要求的具有各种属性的句子。量化评估验证了该模型的生成准确性。
Mar, 2017
本论文从因果的角度出发,提出了一种由结构性因果模型构建的可控文本生成框架,并将其应用于集中控制性文本生成领域的实践,实验表明该方法在控制准确性和减少偏差方面具有优势。
Jan, 2022
本文提出一种新颖的任务,通过神经模块来控制句子的语法以及运用多任务训练的目标来提高表示学习,从而实现可控文本生成,并在基线实验的基础上实现性能的提升和捕捉理想特征。
Jun, 2019
提出一种新的上下文化摘要方法,该方法可以根据含有引用文献的句子(称为 “引文”)生成信息丰富的摘要,概述了引文相关引用位置的文献内容,该方法提取和建模论文的引文,检索相关的引用文献段落,并生成针对每个引文的抽象摘要。
Nov, 2023
本文提出了一种名为 “先选后生成” 的本地可归属文本生成方法,通过将传统的端到端生成过程分为三个直观步骤:内容选择、句子规划和顺序句子生成,从而确保相关源片段同时充当输出的细粒度归属,以此解决了大规模语言模型中幻觉问题,并在多文档摘要和长篇问答上取得了更简洁的引文而保持较高的生成质量和归属准确性,同时还显著降低了人工审核的事实验证时间。
Mar, 2024
基于大型语言模型的引文生成方法,旨在解决单段落引文生成的挑战,研究通过整合多个目标论文与单个源论文,生成包含多个句子引文文本的连贯段落。同时,通过将目标论文的知识图谱整合到生成引文文本的提示中实现了更好的性能,这一研究揭示了利用大型语言模型进行引文生成的潜力,为探索科学文档之间的复杂连接打开了一个引人注目的途径。
本文提出一种使用特殊标记来控制生成文本中关键字的相对位置的方法,实验证明该方法可以更好地符合用户意图,生成更接近用户意图的摘要文本。
Apr, 2023