文本事实传递
文本风格转换方法在自然语言处理中越来越受欢迎,允许将文本从有毒到神经、从正式到非正式、从古老到现代英语等形式进行改写。在一些应用中,解决这一任务不仅仅是生成一些神经 / 非正式 / 现代化的文本,更重要的是保持原始内容不变。通过比较各种风格转换模型在正式转换领域的实例,我们对各种风格转换方法的内容保留能力进行了研究。我们创建了一个形式与非正式任务导向的对话的平行数据集,与 GYAFC 等现有数据集的关键区别是包含了必须在改写过程中保留的预定义语义槽,例如命名实体。这个额外的注释允许我们对几种最先进的风格转换技术进行精确的对比研究。我们研究的另一个结果是对无监督方法 LEWIS 进行改进,在所提出的任务中取得了明显的改进,优于原始方法和所有评估的基准方法。
Aug, 2023
该研究提出了内容转移技术,该技术可以在长文本生成中通过引用外部文本源,例如新闻报道,生成适合文本上下文并富含内容的下一句话。我们在 Wikipedia 数据上的实验结果显示出明显的改进,并在此次研究中发布了 640K Wikipedia 参考句子及源文章的基准数据集。
May, 2019
该研究提出了一个基于自然语言的控制生成任务,可将一系列事实扩展为更长的叙述,并通过引入人类评估指标和大型训练数据集的方法评估了三种方法,证明了自回归的单向语言模型如 GPT2 的生成流畅度更好,但很难遵循所请求的事实,提出了一个基于计划和填空模型的解决方案(使用精细调整的 XLNet),其生成流畅度有竞争力,同时遵循所请求的内容。
Dec, 2020
该论文系统调查了 100 多篇关于神经文本风格迁移的文章,分析了任务制定,现有数据集和子任务的方法,评估以及并行和非并行数据的方法等方面,并就未来该领域的发展进行了讨论。
Nov, 2020
本文提出了一种基于结构化细粒度监督的内容保留模型,利用语言信息并设定模型目标以达到在改变句子的风格的同时更好地保留与风格无关的内容,进行情感和政治倾向转换任务的实验表明该模型在内容保留和风格转换上表现出显著改善。
Oct, 2018
本文探讨了最近机器学习的几篇主题是关于文本的自动化风格转移的研究,不同的研究者提出了不同的算法、数据集和目标指标来解决这一 NLP 任务,本文致力于讨论这一 NLP 任务的可能形式化,以期进一步增加对它的兴趣。
Aug, 2018
本文介绍了一种基于双向形状匹配框架的文本风格转移网络,该网络允许通过可调参数对字形的关键风格程度进行实时控制,这种方法能够持续表征样式图像的多尺度形状特征并将这些特征传递到目标文本中,有效地解决了文本风格转移中控制样式形变的问题,达到了比先前技术更好的效果。
May, 2019
本文通过提出一种全能模型,同时采用平行数据和形式分类数据,以缓解数据稀疏性问题,并在形式转换基准数据集上取得最新的最优表现,发现该模型还可轻松适用于其他无监督文本样式转换任务,如无监督情感转换,并在三个广泛认可的基准测试中取得竞争优势。
Mar, 2019
本文综合评述了最近文本风格迁移的研究进展,提出了一种按类别组织 TST 模型的分类法,并提供了一份最新技术的综合摘要。我们还检验了 19 种最先进的 TST 算法并提供当前趋势的新视角。
Oct, 2020