GYAFC 数据集：正式语体转换的语料库、基准和度量标准

Mar, 2018

GYAFC 数据集：正式语体转换的语料库、基准和度量标准

Dear Sir or Madam, May I introduce the GYAFC Dataset: Corpus, Benchmarks and Metrics for Formality Style Transfer

Sudha Rao, Joel Tetreault

TL;DR本研究创造出最大的专门风格转换语料库，针对形式化语言的风格，显示了使用机器翻译技术作为未来工作的强有力基线，并讨论了使用自动指标的挑战。

Abstract

style transfer is the task of automatically transforming a piece of text in one particular style into another. A major barrier to progress in this field has been a lack of training and evaluation datasets, as well as benchmarks and →

style transfer training dataset evaluation dataset machine translation automatic metrics

发现论文，激发创造

混合文本注解的正式风格转换

本文通过提出一种全能模型，同时采用平行数据和形式分类数据，以缓解数据稀疏性问题，并在形式转换基准数据集上取得最新的最优表现，发现该模型还可轻松适用于其他无监督文本样式转换任务，如无监督情感转换，并在三个广泛认可的基准测试中取得竞争优势。

Mar, 2019

以人类判断为指南，引导正式转移的自动度量

本文针对文本形式转换的评估问题进行研究，重点关注了风格强度、内容保留和流畅度等三个方面的评估，对常见与新型度量标准进行了人工评估和相关分析，提出了在通用性使用情况下建议及其在相关任务中的外推性。

Apr, 2022

评估风格迁移的评价指标：以多语言形式转移为例的案例研究

本文评估了风格转移 (ST) 领域自动度量标准对于形式风格转移这一常见任务的效果，包含了葡萄牙语、法语和意大利语，这是这一领域第一个多语言评估的工作，提出了最佳实践，指出了几个与人类评测高度一致的、在多语言下表现良好的模型，期望协助加速风格转移 (ST) 的发展。

Oct, 2021

形式转换的并行数据增强

本论文研究如何增广平行数据，提出了新颖且简单的数据增广方法来获得有用的句子对，并表明采用增广平行数据进行预训练可以帮助改善正式语体转换，并在 GYAFC 基准数据集中取得了最先进的结果。

May, 2020

现实世界文本风格转移自动评估的艰巨任务

本文讨论了文本风格迁移技术中的关键问题，即使用无监督生成方法，自动评估风格迁移任务的难点。通过对类似文献的总结，我们阐述了当前风格迁移研究的问题，并指出现有的自动评估方法存在缺陷，无法准确评估迁移后句子的风格准确性、内容相似度和流畅性。本文旨在引导研究者思考风格迁移和评估研究的未来趋势。

Oct, 2019

基于强化学习的无需平行训练语料库的文本风格转移

本研究利用强化学习生成评估器结构，使用基于注意力的编码 - 解码器转换源风格的句子至目标风格，并进行了语义和句法限制的对抗训练风格鉴别器，成功实现了无平行训练语料库的文本风格转移，并在两种不同的风格转移任务（情感转移和形式转移）中取得了优于现有方法的结果，并进一步进行了手动评估，证明了所提出方法在生成文本质量方面的有效性。

Mar, 2019

半监督形式化风格转移及其一致性训练

本文提出了一种半监督框架，通过一致性训练来更好地利用源端未标记句子，其中采用了数据扰动方法来增广伪平行数据，并提出了有效的数据过滤策略，实现了在 GYAFC 基准测试中获得最先进的结果。

Mar, 2022

专家风格转换：专家和外行更好沟通的新任务

该研究提出了专业语言简化的新任务，并贡献了一个手工注释的数据集，以减轻知识差异带来的沟通障碍。研究表明五种最先进的模型在样式转移和文本简化方面的表现存在明显差距，并探讨了自动评估的挑战和未来的研究方向。

May, 2020

从具有任意未知样式的句子进行语言风格转移

该研究论文介绍了一种利用内容和风格潜在表示进行语言风格转换的方法，并证明了该模型在餐厅评论情感修改、浪漫风格对话回复和莎士比亚风格语句重写等三种任务中具有有效性。

Aug, 2018

风格转换作为无监督机器翻译

本文提出一种使用无监督机器翻译方法来实现自动语言风格转换的方法，利用样式偏好信息和单词嵌入相似性来生成伪平行数据，并采用迭代回译方法来联合训练两个神经机器翻译（NMT）系统，其中引入样式分类器来控制噪声。实验表明，该方法在语言风格转换的精确度和输入输出对应质量方面优于以前的现有模型。

Aug, 2018