本文探讨了自然语言生成在任务导向对话中的应用,提出了三种序列到序列模型,并考虑如何实现内容和风格的分离,通过控制36个风格参数,实现对语义和风格的高度还原。
May, 2018
本研究提出了从词汇、句法和语义三个方面分析个体写作风格的过程,并展示该过程在作者风格分析、作者归属度和情感预测方面的应用,结果表明这种多层次的写作风格分析方法能够量化地模拟文本中的主观性,从而在多个任务上提高定量和定性表现。
Sep, 2019
本文提供了一个新的语料库(xSLUE)以用于句子级跨风格语言理解和评估,并提出了三种跨风格应用程序:分类、相关性和生成,从而帮助探索跨风格研究的有趣未来方向。
Nov, 2019
本文介绍了使用独立获取的数据来控制多种风格的方法,旨在解决现有方法中需要联合注释所有风格维度的共同缺点,通过与现有技术的比较,我们的模型能够保留输入文本的内容,同时控制多个风格维度。
Oct, 2020
通过大规模的跨作者比较,我们引入了一种新方法来通过识别和编码风格特征来研究idiolects,神经模型在短文本上实现了强大的作者识别性能,并通过类比探测任务展示出学习到的表示具有惊人的规律性,在文本扰动中,我们量化了不同语言元素对idiolectal变化的相对贡献,同时通过测量互作者和内作者的变化来描述idiolects,这些结果表明idiolectal的变化具有独特而一致的特征。
Sep, 2021
提出模块化、细粒度和内容控制的基于相似度的STEL模型,用于测试比较两个句子风格的任何模型的性能,并发现基于BERT的方法优于其他常用的风格度量方法,希望加入更多任务和任务实例来促进风格敏感度量的改进。
本文提出一种迁移学习框架,通过更新模型参数的0.3%来学习响应生成的特定风格属性,解决了在话务系统中保持一致的人物形象和风格的问题。研究表明,个性是改善会话系统参与度和用户体验的关键驱动因素。同时,本研究通过在ROC故事语料库中研究风格故事结尾生成问题,从PERSONALITY-CAPTIONS数据集中学习风格特定属性,并通过大量实验和评估表明,该新颖的训练方法可以提高风格生成的效果。
Oct, 2022
本篇研究介绍了StyLEx,一种使用人工识别的文体词汇作为预测句子文体的附加信息的模型,它不会牺牲原始并且跨域数据集上的句子级文体预测性能,同时可以提供类似于人类感知的文体词汇解释。
本文以戏剧作品为例,分析了角色特点的语言风格区别,提出了两种新的分析独特性的方法,并应用于法语、德语、俄语和莎士比亚作品的语料库中,以探讨不同语言和时期的比较分析。研究发现,女性角色在直接的叙述和情感主题上的语言风格更具独特性。这一发现为未来更深入的研究提供了思路。
Jan, 2023
使用解释框架从多语言语言模型中提取风格差异,比较不同语言之间的风格差异,探索礼貌在四种语言中的变化,进一步评估不同语言类别如何对风格变化做出贡献,并提供人们在全球范围内沟通差异的可解释性见解。
Oct, 2023