QURIOUS：文本生成的问题生成预训练

Apr, 2020

QURIOUS：文本生成的问题生成预训练

QURIOUS: Question Generation Pretraining for Text Generation

Shashi Narayan, Gonçalo Simoes, Ji Ma, Hannah Craighead, Ryan Mcdonald

TL;DR本文介绍了一种新型文本生成的预训练方法 —— 提问生成法，并通过与抽象总结和面向回答问题的问题生成两个文本生成任务的实验，证明了该方法优于以往的预训练方法，能够更好地理解输入并生成更自然、简洁和丰富的文本。

Abstract

Recent trends in natural language processing using pretraining have shifted focus towards pretraining and fine-tuning approaches for

natural language processing pretraining question generation text generation language modeling

发现论文，激发创造

基于文本的神经问答生成：初步研究

本研究提出了一种基于神经编码器 - 解码器模型的自动问题生成方法，可以根据给定的段落生成多样化、有意义的问题并利用 SQuAD 数据集进行了初步实验研究，实验结果显示该方法可以产生流畅且多样化的问题。

Apr, 2017

学会提问：神经网络阅读理解问题生成

该研究采用基于注意力机制的序列自学习模型进行阅读理解中基于句子的自动问题生成，相比于之前的工作，该模型不依赖于手工规则或复杂的自然语言处理技术，并在人工和自动评估中都呈现出更加自然和困难的问题。

Apr, 2017

通过文本到文本神经问题生成的机器理解

本文提出了一种基于递归神经网络的模型，可以根据答案生成自然语言问题，并介绍了一种使用监督学习和强化学习相结合的方式对模型进行训练，然后通过策略梯度技术微调模型以最大化几个衡量问题质量的奖励，其中一个奖励是一个问题回答系统的表现，并通过最近的问答数据集 SQuAD 对模型进行了训练和评估。

May, 2017

用科学文本进行预训练，提高教育问题生成质量

本研究基于大型语言模型开发了 EduQG，该模型能够自动生成出优质的教育问题，以实现在数字化教育材料和可扩展的 e-learning 系统背景下的 AI 协助个性化学习。

Dec, 2022

利用 Transformer 语言模型简化段落级问题生成

Question generation is a natural language generation task that can be achieved with a single Transformer-based unidirectional language model, which outperforms QG baselines and produces high-quality questions that are relevant to their context paragraph and easy to answer, utilizing transfer learning without relying on auxiliary data.

May, 2020

基于机器学习方法的句子结构分析自动生成问题

本文介绍了我们使用传统语言学方法和多种机器学习技术生成英语非结构化文本问句的框架，并且加入了问题评估模块，最终证明我们的生成问题质量优于其他最好的系统，并且与人类创建的问题相当。

May, 2022

利用检索句子生成模板的方式提高无监督问答

我们提出了一种无监督训练 QA 模型的方法，该方法使用生成的伪数据训练，为 QA 训练生成问题，通过对相关检索到的句子应用简单模板，而非原始上下文句子来实现，从而使模型能够学习更复杂的上下文问题关系。使用这些数据训练 QA 模型可在 SQuAD 数据集上获得 14％的 F1 分数相对提高，并且在答案为命名实体时提高 20％，从而实现无监督 QA 的最新性能。

Apr, 2020

通过摘要信息生成问题提高无监督问答

本文提出一种基于无监督学习的问句生成方法，使用自由可得的新闻标题数据通过句法分析、命名实体识别和语义角色标注启发式技术转换成合适的问题，然后与原始新闻文章一起训练一个端到端的神经问句生成模型；通过在多项数据集上的实验证明，该方法生成的人工智能数据集用于训练问答模型，其性能远超过基于无监督学习的问答模型的现有成果。

Sep, 2021

仿人类提问：基于文本语料库的可扩展问答生成

本文提出了一种名为 ACS-QG 的问题生成系统，使用信息抽取、神经网络生成器和质量控制器自动生成高质量、多样化的问题 - 答案对，该系统超越了现有神经网络问题生成模型，并能从较少的数据中生成 280 万个高质量的问题 - 答案对。

Jan, 2020

利用答案焦点、语境和语言特征进行不同类型问题的神经生成

本篇论文提出了一种新的 Attentional Encoder-Decoder Recurrent Neural Network 模型用于自动生成问题，该模型融合语言特征和句子嵌入来捕捉句子和单词层面上的意义，并采用复制机制和特殊答案信号生成多样化的问题，在基准问题生成数据集上取得了 19.98 的 Bleu_4 结果，超过了以前发表的所有结果，并且人类评估显示这些新增的功能提高了生成的问题的质量。

Sep, 2018