带有问答蓝图的条件生成
通过问题 - 答案对的序列作为引导文本生成的蓝图计划,将计划作为中介步骤,可以更好地控制条件生成模型的生成过程。我们提出了一种基于 Web 浏览器的演示,用于查询聚焦摘要,演示用户如何与生成的文本交互并使用基于蓝图的计划可视化来控制生成的输出。
Apr, 2023
将图像序列转化为可解释的视觉前缀,结合预训练语言模型和规划,利用问题 - 答案对作为蓝图计划选择显著的视觉概念,并确定它们如何组织成故事,生成更连贯、有趣和自然的故事。
Oct, 2023
我们在这篇论文中探讨了最近显示对于生成的文本的逼真性、基础性和可控性有所改进的计划型模型的归因能力,该模型将计划概念化为一系列问题,旨在作为生成内容及其组织的蓝图。我们提出了两个利用不同蓝图变体的归因模型,一个是从头开始生成问题的抽象模型,另一个是从输入中复制问题的抽取模型。在长文问题回答的实验中,规划始终能够提高归因质量,此外,蓝图模型生成的引用文献与缺乏规划组件的基于 LLM 的流程获得的引用相比更加准确。
Apr, 2024
本论文考虑数据到文本生成的任务,着重提出了一种生成长篇文章的神经模型,增加了计划组件来组织高层次信息,在结构化变分模型的帮助下逐步推理出潜在计划,从而生成文本。在 RotoWire 和 MLB 两个数据到文本基准测试中,本模型表现优于基准模型,并且在训练数据有限的情况下具有较高的样本效率。
Feb, 2022
我们提出了一种使用自动生成的训练数据生成高性能任务特定问答模型的方法,该方法可以在手机等终端上运行且竞争力强,通过从过程性文本中自动生成详尽的领域内问答对进行训练,结构化的过程性文本是关键的技术支持。
Jan, 2024
本文从 Moryossef et al (2019)所提出的步骤式神经数据到文本生成方法出发,通过引入可训练的神经计划组件、打字提示、排序确认阶段和简单而有效的指代表达式生成模块的四个扩展,实现了一个更快,更流畅和更准确的生成过程。
Sep, 2019
提出了使用深度学习方法和序列学习方法生成阅读理解中多项选择题的解题方法,包括问题生成和干扰项生成。通过多种自然语言处理技术的组合,这些方法可以在未见数据上表现良好。
Mar, 2023
将数据转文本生成过程拆分为符号文本计划和神经生成两个阶段,通过匹配参考文本和选择高质量文本计划提高系统的可靠性和适用性,同时保持流畅的输出。在 WebNLG 基准测试中得到了 BLEU 得分和人工评估的改善,并能够输出同一输入的多种不同的实现,为生成文本结构的显式控制铺平了道路。
Apr, 2019
提出了一个基于多层次内容规划的新型问句生成框架 MultiFactor,通过同时选择关键短语和生成完整答案进行问句生成,引入了完整答案生成来连接短答案和选定的关键短语,从而形成帮助问句生成的答案感知摘要。代码可在此链接中获取。
Oct, 2023
本研究提出了一种 Plan-then-Generate(PlanGen)框架,以改善神经数据生成文本模型的可控性,并通过两个基准数据集 ToTTo 和 WebNLG 进行了广泛的实验和分析,结果显示,我们的模型能够控制生成输出的句内和句间结构,而且与先前的最先进方法进行了实证比较,显示出我们的模型提高了生成质量以及人机评估的输出多样性。
Aug, 2021