带有问答蓝图的条件生成

Jul, 2022

Conditional Generation with a Question-Answering Blueprint

Shashi Narayan, Joshua Maynez, Reinald Kim Amplayo, Kuzman Ganchev, Annie Louis...

TL;DR本文介绍了一种利用文本计划作为中介表示来使条件生成更加有根据的方法，并以问题 - 答案对的序列形式对文本计划进行了新的概念化，提出了 Transformer 模型，实现了将计划纳入生成输出的目的。

Abstract

The ability to convey relevant and faithful information is critical for many tasks in conditional generation and yet remains elusive for neural seq-to-seq models whose outputs often reveal hallucinations and fail to correctly cover important details. In this work, we advocate

conditional generation neural seq-to-seq models text plans question-answer pairs planning

发现论文，激发创造

Text-Blueprint: 基于计划的条件生成的交互平台

通过问题 - 答案对的序列作为引导文本生成的蓝图计划，将计划作为中介步骤，可以更好地控制条件生成模型的生成过程。我们提出了一种基于 Web 浏览器的演示，用于查询聚焦摘要，演示用户如何与生成的文本交互并使用基于蓝图的计划可视化来控制生成的输出。

Apr, 2023

问题 - 答案计划的视觉叙事

将图像序列转化为可解释的视觉前缀，结合预训练语言模型和规划，利用问题 - 答案对作为蓝图计划选择显著的视觉概念，并确定它们如何组织成故事，生成更连贯、有趣和自然的故事。

Oct, 2023

学习计划与引文生成文本

我们在这篇论文中探讨了最近显示对于生成的文本的逼真性、基础性和可控性有所改进的计划型模型的归因能力，该模型将计划概念化为一系列问题，旨在作为生成内容及其组织的蓝图。我们提出了两个利用不同蓝图变体的归因模型，一个是从头开始生成问题的抽象模型，另一个是从输入中复制问题的抽取模型。在长文问题回答的实验中，规划始终能够提高归因质量，此外，蓝图模型生成的引用文献与缺乏规划组件的基于 LLM 的流程获得的引用相比更加准确。

Apr, 2024

变分序列计划数据生成技术

本论文考虑数据到文本生成的任务，着重提出了一种生成长篇文章的神经模型，增加了计划组件来组织高层次信息，在结构化变分模型的帮助下逐步推理出潜在计划，从而生成文本。在 RotoWire 和 MLB 两个数据到文本基准测试中，本模型表现优于基准模型，并且在训练数据有限的情况下具有较高的样本效率。

Feb, 2022

面向程序化问答的图引导问题回答生成

我们提出了一种使用自动生成的训练数据生成高性能任务特定问答模型的方法，该方法可以在手机等终端上运行且竞争力强，通过从过程性文本中自动生成详尽的领域内问答对进行训练，结构化的过程性文本是关键的技术支持。

Jan, 2024

基于计划的神经数据到文本生成的质量和效率提升

本文从 Moryossef et al （2019）所提出的步骤式神经数据到文本生成方法出发，通过引入可训练的神经计划组件、打字提示、排序确认阶段和简单而有效的指代表达式生成模块的四个扩展，实现了一个更快，更流畅和更准确的生成过程。

Sep, 2019

自动生成多项选择题

提出了使用深度学习方法和序列学习方法生成阅读理解中多项选择题的解题方法，包括问题生成和干扰项生成。通过多种自然语言处理技术的组合，这些方法可以在未见数据上表现良好。

Mar, 2023

逐步：在神经数据到文本生成中分离规划和实现

将数据转文本生成过程拆分为符号文本计划和神经生成两个阶段，通过匹配参考文本和选择高质量文本计划提高系统的可靠性和适用性，同时保持流畅的输出。在 WebNLG 基准测试中得到了 BLEU 得分和人工评估的改善，并能够输出同一输入的多种不同的实现，为生成文本结构的显式控制铺平了道路。

Apr, 2019

多层次内容规划改进问题生成

提出了一个基于多层次内容规划的新型问句生成框架 MultiFactor，通过同时选择关键短语和生成完整答案进行问句生成，引入了完整答案生成来连接短答案和选定的关键短语，从而形成帮助问句生成的答案感知摘要。代码可在此链接中获取。

Oct, 2023

计划 - 生成：通过计划控制数据到文本的生成

本研究提出了一种 Plan-then-Generate（PlanGen）框架，以改善神经数据生成文本模型的可控性，并通过两个基准数据集 ToTTo 和 WebNLG 进行了广泛的实验和分析，结果显示，我们的模型能够控制生成输出的句内和句间结构，而且与先前的最先进方法进行了实证比较，显示出我们的模型提高了生成质量以及人机评估的输出多样性。

Aug, 2021