男性本科生和女性博士生具有不同的含义：具有多个人格的平行注释风格语言数据集

Aug, 2019

男性本科生和女性博士生具有不同的含义：具有多个人格的平行注释风格语言数据集

(Male, Bachelor) and (Female, Ph.D) have different connotations: Parallelly Annotated Stylistic Language Dataset with Multiple Personas

HTML

PDF

Dongyeop Kang, Varun Gangal, Eduard Hovy

TL;DR通过发布一个包含不同身份的8.3K个句子集合PASTEL，我们可以控制文体的改变并且更准确的评估和设计目标样式和风格转移实验。

Abstract

stylistic variation in text needs to be studied with different aspects including the writer's personal traits, interpersonal relations, rhetoric, and more. Despite recent attempts on computational modeling of the

发现论文，激发创造

用神经自然语言生成器控制基于个性的风格变化

本文探讨了自然语言生成在任务导向对话中的应用，提出了三种序列到序列模型，并考虑如何实现内容和风格的分离，通过控制36个风格参数，实现对语义和风格的高度还原。

May, 2018

文本风格的词汇、句法和语义视角

本研究提出了从词汇、句法和语义三个方面分析个体写作风格的过程，并展示该过程在作者风格分析、作者归属度和情感预测方面的应用，结果表明这种多层次的写作风格分析方法能够量化地模拟文本中的主观性，从而在多个任务上提高定量和定性表现。

Sep, 2019

风格不是单一变量：跨风格语言理解的案例研究

本文提供了一个新的语料库（xSLUE）以用于句子级跨风格语言理解和评估，并提出了三种跨风格应用程序：分类、相关性和生成，从而帮助探索跨风格研究的有趣未来方向。

Nov, 2019

基于不相交语料库的风格多样迁移及鉴别反馈

本文介绍了使用独立获取的数据来控制多种风格的方法，旨在解决现有方法中需要联合注释所有风格维度的共同缺点，通过与现有技术的比较，我们的模型能够保留输入文本的内容，同时控制多个风格维度。

Oct, 2020

独特而非武断：在线寄存器中学习个人语言风格揭示了独特但一致的个体风格

通过大规模的跨作者比较，我们引入了一种新方法来通过识别和编码风格特征来研究idiolects，神经模型在短文本上实现了强大的作者识别性能，并通过类比探测任务展示出学习到的表示具有惊人的规律性，在文本扰动中，我们量化了不同语言元素对idiolectal变化的相对贡献，同时通过测量互作者和内作者的变化来描述idiolects，这些结果表明idiolectal的变化具有独特而一致的特征。

Sep, 2021

一个基于模块化和相似性的语言风格评估框架：能否捕捉STEL？

提出模块化、细粒度和内容控制的基于相似度的STEL模型，用于测试比较两个句子风格的任何模型的性能，并发现基于BERT的方法优于其他常用的风格度量方法，希望加入更多任务和任务实例来促进风格敏感度量的改进。

Sep, 2021

基于转移学习和 Adapter 的无监督神经风格文本生成

本文提出一种迁移学习框架，通过更新模型参数的0.3％来学习响应生成的特定风格属性，解决了在话务系统中保持一致的人物形象和风格的问题。研究表明，个性是改善会话系统参与度和用户体验的关键驱动因素。同时，本研究通过在ROC故事语料库中研究风格故事结尾生成问题，从PERSONALITY-CAPTIONS数据集中学习风格特定属性，并通过大量实验和评估表明，该新颖的训练方法可以提高风格生成的效果。

Oct, 2022

StyLEx: 用基于词典的人类感知解释风格

本篇研究介绍了StyLEx，一种使用人工识别的文体词汇作为预测句子文体的附加信息的模型，它不会牺牲原始并且跨域数据集上的句子级文体预测性能，同时可以提供类似于人类感知的文体词汇解释。

Oct, 2022

从舞台到页面：虚构语言独特性的无语言自举测量方法

本文以戏剧作品为例，分析了角色特点的语言风格区别，提出了两种新的分析独特性的方法，并应用于法语、德语、俄语和莎士比亚作品的语料库中，以探讨不同语言和时期的比较分析。研究发现，女性角色在直接的叙述和情感主题上的语言风格更具独特性。这一发现为未来更深入的研究提供了思路。

Jan, 2023

跨语言风格比较

使用解释框架从多语言语言模型中提取风格差异，比较不同语言之间的风格差异，探索礼貌在四种语言中的变化，进一步评估不同语言类别如何对风格变化做出贡献，并提供人们在全球范围内沟通差异的可解释性见解。

Oct, 2023