QURIOUS:文本生成的问题生成预训练
本研究提出了一种基于神经编码器 - 解码器模型的自动问题生成方法,可以根据给定的段落生成多样化、有意义的问题并利用 SQuAD 数据集进行了初步实验研究,实验结果显示该方法可以产生流畅且多样化的问题。
Apr, 2017
该研究采用基于注意力机制的序列自学习模型进行阅读理解中基于句子的自动问题生成,相比于之前的工作,该模型不依赖于手工规则或复杂的自然语言处理技术,并在人工和自动评估中都呈现出更加自然和困难的问题。
Apr, 2017
本文提出了一种基于递归神经网络的模型,可以根据答案生成自然语言问题,并介绍了一种使用监督学习和强化学习相结合的方式对模型进行训练,然后通过策略梯度技术微调模型以最大化几个衡量问题质量的奖励,其中一个奖励是一个问题回答系统的表现,并通过最近的问答数据集 SQuAD 对模型进行了训练和评估。
May, 2017
本研究基于大型语言模型开发了 EduQG,该模型能够自动生成出优质的教育问题,以实现在数字化教育材料和可扩展的 e-learning 系统背景下的 AI 协助个性化学习。
Dec, 2022
Question generation is a natural language generation task that can be achieved with a single Transformer-based unidirectional language model, which outperforms QG baselines and produces high-quality questions that are relevant to their context paragraph and easy to answer, utilizing transfer learning without relying on auxiliary data.
May, 2020
本文介绍了我们使用传统语言学方法和多种机器学习技术生成英语非结构化文本问句的框架,并且加入了问题评估模块,最终证明我们的生成问题质量优于其他最好的系统,并且与人类创建的问题相当。
May, 2022
我们提出了一种无监督训练 QA 模型的方法,该方法使用生成的伪数据训练,为 QA 训练生成问题,通过对相关检索到的句子应用简单模板,而非原始上下文句子来实现,从而使模型能够学习更复杂的上下文问题关系。 使用这些数据训练 QA 模型可在 SQuAD 数据集上获得 14%的 F1 分数相对提高,并且在答案为命名实体时提高 20%,从而实现无监督 QA 的最新性能。
Apr, 2020
本文提出一种基于无监督学习的问句生成方法,使用自由可得的新闻标题数据通过句法分析、命名实体识别和语义角色标注启发式技术转换成合适的问题,然后与原始新闻文章一起训练一个端到端的神经问句生成模型;通过在多项数据集上的实验证明,该方法生成的人工智能数据集用于训练问答模型,其性能远超过基于无监督学习的问答模型的现有成果。
Sep, 2021
本文提出了一种名为 ACS-QG 的问题生成系统,使用信息抽取、神经网络生成器和质量控制器自动生成高质量、多样化的问题 - 答案对,该系统超越了现有神经网络问题生成模型,并能从较少的数据中生成 280 万个高质量的问题 - 答案对。
Jan, 2020
本篇论文提出了一种新的 Attentional Encoder-Decoder Recurrent Neural Network 模型用于自动生成问题,该模型融合语言特征和句子嵌入来捕捉句子和单词层面上的意义,并采用复制机制和特殊答案信号生成多样化的问题,在基准问题生成数据集上取得了 19.98 的 Bleu_4 结果,超过了以前发表的所有结果,并且人类评估显示这些新增的功能提高了生成的问题的质量。
Sep, 2018