基于 Bootstrapping 和步进强化奖励的语言风格转化半监督框架学习

ACLMay, 2022

基于 Bootstrapping 和步进强化奖励的语言风格转化半监督框架学习

Learning from Bootstrapping and Stepwise Reinforcement Reward: A Semi-Supervised Framework for Text Style Transfer

Zhengyuan Liu, Nancy F. Chen

TL;DR本研究提出一种使用半监督框架和强化返馈来解决文本风格转移挑战的方法，通过自动构建伪并行对来引导监督学习并通过强化奖励学习未标注数据，提供细粒度的学习信号来稳定增强学习，并取得了多个数据集上最先进的性能。

Abstract

text style transfer is an important task in controllable language generation. supervised approaches have pushed performance improvement on style-oriented rewriting such as formality conversion. However, challenge

text style transfer supervised approaches unsupervised approaches semi-supervised framework reinforcement rewards

发现论文，激发创造

无监督文本风格转移的双重强化学习框架

本文提出了一种基于双重强化学习框架的一步映射模型，以直接传输文本的风格，而无需分离内容和风格，通过在双重结构上设计的两种奖励来反映风格准确性和内容保留。这种方法可以在没有使用并行数据的情况下通过强化学习训练出两个一步映射模型，评估表明该模型在两个基准数据集上表现优于现有技术，特别是 BLEU 分数平均提高了 8 分以上，人类评估也验证了该模型在风格准确性、内容保留和流畅性方面的有效性。

May, 2019

深层生成模型进行无监督文本风格转换

我们提出了一个用深度生成模型进行无监督文本风格转换的通用框架，该框架利用观察数据中的依赖关系学习内容和风格的潜在代码，并通过操纵这些代码来转换句子。实验结果表明，与几个强基准方法相比，我们的方法在自动评估和人工评估中取得了更好或具有竞争力的结果。

Aug, 2023

文本风格转移的强化奖励框架

本文提出了一种基于强化学习的框架，以直接优化目标度量标准的方式实现文本风格转移，取得了比现有最新技术更好的性能。

May, 2020

学习文本风格转移与直接奖励

本研究探讨了一种基于奖励机制的训练算法以进行文本风格转换任务，结合神经机器翻译模型的语义相似度度量来显式评估系统输出与输入文本之间内容的保留，实验结果显示该模型相对于强基准系统在自动和人类评估上具有显著的优势。

Oct, 2020

风格转换作为无监督机器翻译

本文提出一种使用无监督机器翻译方法来实现自动语言风格转换的方法，利用样式偏好信息和单词嵌入相似性来生成伪平行数据，并采用迭代回译方法来联合训练两个神经机器翻译（NMT）系统，其中引入样式分类器来控制噪声。实验表明，该方法在语言风格转换的精确度和输入输出对应质量方面优于以前的现有模型。

Aug, 2018

基于对比学习的梯度导向无监督文本风格转换

本文提出了一种基于对比学习范式的新型文本风格转换模型，通过明确收集相似语义句子和设计基于孪生模型的风格分类器，以解决文本样式转换中的内容迁移和样式歧义等问题。针对这些问题，实验结果表明，该模型比现有技术更加有效。

Jan, 2022

多迭代偏好优化的风格转换

通过引入探索和优化的多次迭代和希望与恐惧采样策略，以及伪平行生成方法和动态加权奖励聚合方法来改进偏好优化方法，本文在两个常用的文本风格转换数据集上评估模型，通过自动化和人工评估结果展示了我们模型相对于最先进基准的有效性和优越性。

Jun, 2024

基于强化学习的无需平行训练语料库的文本风格转移

本研究利用强化学习生成评估器结构，使用基于注意力的编码 - 解码器转换源风格的句子至目标风格，并进行了语义和句法限制的对抗训练风格鉴别器，成功实现了无平行训练语料库的文本风格转移，并在两种不同的风格转移任务（情感转移和形式转移）中取得了优于现有方法的结果，并进一步进行了手动评估，证明了所提出方法在生成文本质量方面的有效性。

Mar, 2019

无监督文本风格转移的概率公式

本文提出了一种深度生成模型，用于无监督的文本风格转换，并且统一了先前提出的非生成技术。利用概率方法将两个领域的非平行数据建模为部分观察到的平行语料库，通过假设生成每个观察序列的平行潜在序列，该模型学会了完全无监督的将序列从一个领域转换到另一个领域。

Feb, 2020

STEER: 基于专家强化学习的统一风格转移

STEER 是一个统一的框架，通过专家增强（Expert Reinforcement）实现样式转移，用于解决样式转移中有限并行数据的挑战。该方法在多个目标样式中能够从任意未知源样式进行转移，具有灵活和高效的特性，取得了具有竞争力的基准线之上的最先进结果。

Nov, 2023