本文研究交叉语料库数据补充和数据扩充对匹配条件和失配条件下的语音情感识别模型性能的影响,实验结果表明在失配条件下,使用混合语料库的模型比单一语料库训练更稳定,而且数据扩充对失配条件的提升更为明显。
Jan, 2022
本篇研究提出一种基于面部表情的情感识别的无监督学习方法,通过跨模态蒸馏将面部表情标注传递到语音领域,用于语音情感识别,实现了在未标注音频数据下学习语音情感表示的目标。
Aug, 2018
本文旨在定义一个语音情感识别(SER)模型,能够在自然会话中识别意大利老年人的积极、中性和消极情绪。通过合并英语数据集和意大利语数据集并采用 XGBoost 模型训练,提出了一种适用于多个语种和多个年龄段的通用模型,并提出两种领域自适应策略来使模型适应老年人和意大利人。结果表明,这种方法提高了分类性能,同时也强调了需要收集新的数据集。
Nov, 2022
使用多任务学习以及在深度神经网络中使用性别和自然度等辅助任务来改善情感模型的泛化能力,并在理论模拟和实际数据中比较了单任务学习方法,结果表明多任务学习方法显著提高了情感识别性能,尤其是使用性别和自然度都提高了性能。
Aug, 2017
本文对情感识别中的流行深度学习方法进行了全面评估,发现语音信号中的长距离依赖对情感识别至关重要,而速率变换是获得最稳健性能提升的最佳数据扩增技术之一。
本文介绍了一种使用两种不同情绪注释的对话语料库构建方法,并讨论了该方法在日语对话语料库上的效果。研究结果表明,辨别说话者和听话者情绪有困难,使用多任务学习可以提高情绪辨识能力。
May, 2022
本文提出了一种新颖的情感文本转语音合成方法,通过跨域语音情感识别模型和情感文本转语音模型进行联合训练,从而在不需要情感标签的 TTS 数据集上生成具有情感表现力的语音,并且几乎不影响其语音质量。
Oct, 2020
通过众包的方式,我们发布了一个数据集,包括了 5000 个英文新闻标题的情感、情感体验者和文本线索、相关情感原因和目标,以及读者对标题情感的感知;在此基础上,我们提出了一个多阶段的注释程序,开发了语义角色结构自动预测任务的基线,并讨论了结果,此数据集支持进一步情感分类、情感强度预测、情感原因检验和定性研究。
Dec, 2019
本文采用基于转换器模型和双向 LSTM 网络的方法,结合心理语言学特征进行基于文本的情感检测,在两个基准数据集中表现出可比性,在六个统一情感数据集的迁移学习实验中表现出强大的跨领域泛化功能。
Dec, 2022
本篇研究提出一个基于深度学习和跨媒介表征学习的情感识别方法,该方法融合了文字和语音特征,并通过评估发现其在 IEMOCAP 数据集上表现优于其它方法。
Sep, 2021