移情对话:上下文对话的多层数据集
本文提出了一个新的共情对话生成指标和一个基于具有情感情境的 25k 个会话的新数据集 EmpatheticDialogues,实验表明使用我们的数据集的对话模型被人类评估员认为比仅在大规模互联网对话数据上训练的模型更具有移情能力,同时还通过实验比较了对情感回应进行的对话模型调整,利用现有模型或数据集而无需重新训练完整模型
Nov, 2018
本研究通过五个评估维度研究人们在对话系统中尝试引入共情时所存在的关键点和未来机会,发现用户建模和对用户情感的检测和鉴别是需要进一步研究的核心问题;同时,处理多模式输入,显示更细腻的共情行为,以及包括其他对话系统特征也是需要关注的问题。
May, 2022
提出了一个多维度的共情评估框架,该框架可以测量发言者表达意图以及听众感知到的共情,这两个维度之间存在相互关联,而感知到的共情与对话会话的满意程度有很高的相关性。为了自动测量对话中的共情,进行了不同的建模选项,包括使用预置的大型语言模型和基于序列到序列语言模型的分类器。经过广泛实验,表明使用序列到序列语言模型进行指导微调的分类器相对于之前的研究和竞争基准具有最好的性能。最后,对所提出的分类器的性能进行了全面的消融研究,并提出了将其作为自动对话共情评估指标的建议。
Feb, 2024
该研究提出了一个多模态数据集,用于个人经历分享中的共情研究,其中包含 41 名参与者在与人工智能代理共享脆弱经历并阅读共情共鸣故事期间的 53 小时视频、音频和文本数据。该数据集是首个关于共情的纵向数据集,通过社交机器人在参与者家中一个月的使用中收集,在自然的共情叙事互动中参与者与 AI 代理进行交互。研究引入一项新的任务,基于个人经历预测个体对他人故事的共情,评估其在个人共享故事环境和他们阅读故事的反思中的效果。研究为未来在上下文化和纵向共情建模方面的改进铺平了道路,并为发展富有共情能力的 AI 系统和理解真实世界情境下人类共情的复杂性提供了宝贵资源。
May, 2024
本文提出并评估了一种情感识别标注方案,通过构建自动分割和分类系统,通过调查语言和声学空间中的特征来识别通话中的共情。该系统在呼叫中心对话中表现出明显的优异性能。
May, 2017
我们系统地收集并筛选了 10 个著名数据库中的 801 篇论文,并对选中的 54 篇论文进行了分析。我们将这些论文根据共情检测系统的输入模态(文本、视听、音频和生理信号)进行分组,并对模态特定的预处理和网络架构设计协议、常用数据集描述和可用性细节以及评估协议进行了研究。我们进一步讨论了基于情感计算的共情领域的潜在应用、部署挑战和研究空白,这可以促进新的研究方向。我们相信我们的工作是发展一个包含隐私保护和无偏见、具有文化、多样性和多语言性的共情系统的垫脚石,可以在实践中提高人类生活的整体福祉。
Oct, 2023
本文提出了第一个公开可用的用于检测共情能力预测的标准,采用单项量表的方法可靠捕捉了作者对共情能力的评估,同时也是第一个区分多种共情形式的计算模型,实验表明 CNN 模型表现最佳。
Aug, 2018
该研究提出一种使用对话意图建模和情感分类的混合方法来提高对话生成系统的响应质量和可控性,并采用信息可视化方法分析人类开放域对话中的情感模式和情感分类。
Dec, 2020
我们提出了一种新方法,利用理论驱动的偏好数据集和优化算法来对齐 LLMs,以提高情感回应生成的质量和模型的泛化性能,并通过 EmpatheticDialogues 数据集以及 diff-EPITOME 和 BERTscore 指标来评估其效果。
Jun, 2024