- TinyStyler: 高效的少样本文字风格转换与作者嵌入
TinyStyler 是一种轻量但高效的文本风格转换方法,利用小语言模型和预训练的作者嵌入来进行有效的少样本文本风格转换,表现优于 GPT-4,并在自动和人工评估中超过最近的可控文本生成方法。
- 多迭代偏好优化的风格转换
通过引入探索和优化的多次迭代和希望与恐惧采样策略,以及伪平行生成方法和动态加权奖励聚合方法来改进偏好优化方法,本文在两个常用的文本风格转换数据集上评估模型,通过自动化和人工评估结果展示了我们模型相对于最先进基准的有效性和优越性。
- 大型语言模型是否真正擅长文本风格转换?
我们分析了大型语言模型(LLMs)在文本样式转换(TST)上的性能,特别关注情感转移和文本解毒,在英语、印地语和孟加拉语三种语言中进行。我们使用零样本和少样本提示以及参数高效微调,评估了预训练 LLMs 的能力,使用自动度量、GPT-4 和 - SC2:在长文本风格转移中增强内容保持和风格一致性
我们提出了一种新颖的方法 SC2,其中设计了多层联合风格 - 内容加权(JSCW)模块和风格一致性损失,以解决现有方法在准确评估多词内容属性和保持一致风格方面的困难,进而改善内容保留和风格一致性。
- 多语种文本风格转换:印度语言的数据集与模型
本文旨在通过保留核心内容的同时改变文本的语言风格,重点研究了情感转换这一重要的文本风格转换子任务,涵盖印度语言的广泛范围,包括印地语、马加伊语、马拉雅拉姆语、马拉地语、旁遮普语、奥迪亚语、泰卢固语和乌尔都语;本文介绍了每种语言的正负样式平行 - LMStyle 基准测试:评估聊天机器人的文本风格转移
本研究提出了 LMStyle Benchmark,这是一个适用于聊天风格文本风格转换的评估框架,可以自动化和可扩展地评估大型语言模型的风格转换质量,并引入了适应度等新颖的度量方法,从而更好地反映人类判断。
- 用 LLMs 进行的自述文本风格转换提炼
基于大语言模型和 CoT 提示的 CoTex 框架,在有限的平行数据集约束下,能够优于传统监督微调和知识蒸馏方法的无监督文本风格转换,特别是在资源有限的情况下,同时具有风格转换过程的透明解释。
- 英语和印地语中的文本去毒化作为风格转换
本文研究了文本排毒的任务,即将有害文本自动转化为非有害文本。通过知识迁移、多任务学习和删减重构等方法,我们有效地平衡了文本排毒,同时保留了原始内容和流畅性,并使用提供的数据集进行实验和评估。
- CAT-LLM:使用文本风格定义促使大规模语言模型进行中文文章风格转换
提出了一个中文文章风格转换框架(CAT-LLM),利用大型语言模型(LLMs)的能力,通过自定义的文本风格定义模块(TSD)来全面分析文章特征,高效地进行中文文章风格转换。该框架在许多方面优于当前研究,能够实现准确的转换和内容保持,对各种类 - STEER: 基于专家强化学习的统一风格转移
STEER 是一个统一的框架,通过专家增强(Expert Reinforcement)实现样式转移,用于解决样式转移中有限并行数据的挑战。该方法在多个目标样式中能够从任意未知源样式进行转移,具有灵活和高效的特性,取得了具有竞争力的基准线之上 - EMNLP文本事实传递
通过最小化修改源文本的问答生成方式,ModQGA 能够准确转移到事实内容,同时不丢失源文本的风格。
- 利用大型语言模型进行文本风格转换评估
我们评估了不同的大型语言模型在文本风格转换评估中的性能并提出了输入提示的集成来增加评估的鲁棒性。
- 在内容保持的风格转换方面,不要在改写时丢失信息
文本风格转换方法在自然语言处理中越来越受欢迎,允许将文本从有毒到神经、从正式到非正式、从古老到现代英语等形式进行改写。在一些应用中,解决这一任务不仅仅是生成一些神经 / 非正式 / 现代化的文本,更重要的是保持原始内容不变。通过比较各种风格 - 从大型语言模型中学习序列生成的评估模型
我们提出了 ECT(evaluation capability transfer)方法,通过从 ChatGPT 中学习评价模型,并将其作为奖励模型应用于强化学习和重新排序方法中,以改善序列生成模型。在机器翻译、文本风格转换和摘要任务上的实验 - ACL文本风格转换的反向翻译
提出了一种基于文本风格转换的回译方法 (TST BT),它通过文本风格转换模型修改回译数据的源语言侧,以改善自然输入的翻译质量;TST BT 在各种语言对上取得了显著的翻译效果,并被证明是一种有效的领域自适应数据增强方法。
- ACL文本样式转换评估的标准化与验证呼吁
进行元分析发现 TST 评估在人工和自动化评估方面存在实践上的不一致和显著的标准化和验证差距,提出了要求未来研究满足的需求,以弥补这些差距。
- 多种样式训练数据分布对多样式文本转换的平衡效应
通过平衡训练数据集中每种风格的分布,我们发现均衡的数据集比不平衡或偏斜的数据集产生更有效的多样式控制效果,并通过定量分析探索了训练数据中多种样式分布对风格转换输出的影响,这些结果将更好地指导风格转移数据集的设计。
- 使用 ChatGPT 进行文本风格转移的多维度评估
本文旨在通过评估 ChatGPT 在文本风格转换多维度评估中的作用,与现有的自动度量以及人类判断的对比。结果表明,在不同等级下,与现有的自动度量相比,ChatGPT 与人类判断具有相似的相关性。
- 基于提示的文本风格转移编辑
该论文提出了一种基于提示的文本风格转换编辑方法,其中使用预训练语言模型进行风格分类,使用分类概率计算风格得分,然后通过词级别的编辑,以最大化全面的评分函数来实现风格转换任务,实验表明其性能远高于具有 20 倍参数的现有技术。
- StyleFlow:基于归一化流的潜在表征分离方法用于无监督文本风格转换
本文提出了一种基于分离表示的风格迁移模型 StyleFlow,通过设计注意力耦合层和基于归一化流的数据增强方法来实现通过风格转移实现保留内容。实验结果表明,该模型在大多数度量标准上达到了最先进的性能水平。