本文综述了神经文本生成领域的最新进展和未来方向,包括数据构造、神经框架、训练和推理策略以及评估指标等方面。
Mar, 2022
本调查综述了自然语言生成的定义、应用、方法及评估,提供了一种神经网络生成模型的信息总览。
Jul, 2020
系统综述研究数据到文本生成的现状,包括研究空白、未来方向、挑战以及对应措施,并提供了这个快速发展领域中未来研究的路线图。
Feb, 2024
本文主要探讨自然语言生成器 (NLG) 领域包括方法、评估、任务等方面的相关研究,并特别关注了 NLG 被恶意利用的潜在危险,以及存在的偏见风险。
Aug, 2022
本研究讨论了统计机器学习用于自然语言生成的商业应用的两个主要瓶颈:缺乏可靠的自动评估指标和高质量的领域内语料库。通过彻底分析当前的评估指标并提出需要新的更可靠的指标,我们解决了第一个问题。通过提出一种新的框架来开发和评估用于自然语言生成训练的高质量语料库,我们解决了第二个问题。
Jun, 2017
本教程关注于文本生成,这是一类自然语言生成任务,它以一段文本作为输入,然后生成一篇按照某些特定标准(如可读性或语言风格)改进的修订版本,同时保留原版文本的大部分含义和长度。
Oct, 2023
研究采用新颖的数据生成文本的方式,对当前的文本生成方法进行了探究,并通过提出一系列抽取性评估方法和使用当前神经生成方法得到基线结果。实验结果表明,这些模型产生流畅的文本,但未能令人信服地近似人类生成的文档,甚至模板化的基线方法在某些指标上超过了这些神经模型,尽管复制和重构扩展会导致明显的改进。
Jul, 2017
本研究提出了一种 Plan-then-Generate(PlanGen)框架,以改善神经数据生成文本模型的可控性,并通过两个基准数据集 ToTTo 和 WebNLG 进行了广泛的实验和分析,结果显示,我们的模型能够控制生成输出的句内和句间结构,而且与先前的最先进方法进行了实证比较,显示出我们的模型提高了生成质量以及人机评估的输出多样性。
Aug, 2021
本文系统调查了近期神经文本生成模型的发展,并在两个着名数据集上进行基准实验,讨论其性质和实践结果。
Mar, 2018
本文针对神经问句生成(NQG)提供了综合调查,从语料库、方法学及评价方法等方面审视了 NQG 的发展趋势,并指出 NQG 在学习范式、输入形式和认知水平方面的新趋势以及未来的潜在发展方向。
May, 2019