建立一个包含表达和经验情感标注的对话语料库
介绍了一种新的语音语料库 STUDIES,用于开发一种语音代理程序,可以友好地说话,并通过将 “共情对话” 行为纳入口语对话系统来开发可以更自然地响应用户的声音代理程序。通过将交际者的情感标签和会话上下文嵌入到文本到语音合成中,可以产生与使用代理的情感标签合成的语音相同程度的自然度。
Mar, 2022
实现共情是朝向人性化对话系统的关键步骤。本文提出了一种新的情感相关增强的共情对话生成框架,完整地实现了情感相关的学习、利用和监督。实验结果表明我们的模型在共情感知和表达方面具有优势。
Nov, 2023
本文提出了一种双重生成模型(Dual-Emp),通过集成前向对话模型、后向对话模型和表示情感共识的离散潜变量来实现情感共识的构建,同时利用来自开放域对话的非成对情感数据,产生了比人类注释更高效且成本更低的伪成对共情样本,进而在自动和人工评估中表现出优异的编织性和共情响应。
Sep, 2021
本文介绍了 EmotionLines 数据集,这是第一个只基于文本内容在每个对话中为所有话语进行情感标注的数据集,共包括来自 Friends 电视剧和私人 Facebook 信使对话的 2000 个对话中的 29245 种话语,并为 EmotionLines 中的情感检测模型提供了多个强基线。
Feb, 2018
通过众包的方式,我们发布了一个数据集,包括了 5000 个英文新闻标题的情感、情感体验者和文本线索、相关情感原因和目标,以及读者对标题情感的感知;在此基础上,我们提出了一个多阶段的注释程序,开发了语义角色结构自动预测任务的基线,并讨论了结果,此数据集支持进一步情感分类、情感强度预测、情感原因检验和定性研究。
Dec, 2019
提出了一个多维度的共情评估框架,该框架可以测量发言者表达意图以及听众感知到的共情,这两个维度之间存在相互关联,而感知到的共情与对话会话的满意程度有很高的相关性。为了自动测量对话中的共情,进行了不同的建模选项,包括使用预置的大型语言模型和基于序列到序列语言模型的分类器。经过广泛实验,表明使用序列到序列语言模型进行指导微调的分类器相对于之前的研究和竞争基准具有最好的性能。最后,对所提出的分类器的性能进行了全面的消融研究,并提出了将其作为自动对话共情评估指标的建议。
Feb, 2024
本论文旨在为共情性回应生成设计一种能够通过内容和情感视角对话历史进行编码的框架,从而生成包含内容和情感信息的回应,实验结果表明,该框架在自动和人类评估指标上均取得了最优结果,同时比先前的方法生成了更多的共情回应。
Sep, 2022
通过综合运用常识信息与对话理解,我们提出了一种创新方法,能更深入地理解情感,从而通过有效地提取已知知识图表中的相关常识来与对话内容相结合,实现民族语言混合对话中情感识别的实质性性能改进。
Oct, 2023