一项关于语音情感识别的跨语料库研究

Jul, 2022

一项关于语音情感识别的跨语料库研究

A cross-corpus study on speech emotion recognition

Rosanna Milner, Md Asif Jalal, Raymond W. M. Ng, Thomas Hain

TL;DR研究了通过跨语料库和多领域训练，分类自然和表演情感的影响；结论表明，从人工情感数据集中学习信息并将其应用于多领域的自然情感识别中是可行和有效的。

Abstract

For speech emotion datasets, it has been difficult to acquire large quantities of reliable data and acted emotions may be over the top compared to less expressive emotions displayed in everyday life. Lately, larg

speech emotion datasets acted emotions natural emotions cross-corpus research emotions classification

发现论文，激发创造

跨语料库语音情感识别与数据增强研究

本文研究交叉语料库数据补充和数据扩充对匹配条件和失配条件下的语音情感识别模型性能的影响，实验结果表明在失配条件下，使用混合语料库的模型比单一语料库训练更稳定，而且数据扩充对失配条件的提升更为明显。

Jan, 2022

野外情感语音识别中的跨模态转移

本篇研究提出一种基于面部表情的情感识别的无监督学习方法，通过跨模态蒸馏将面部表情标注传递到语音领域，用于语音情感识别，实现了在未标注音频数据下学习语音情感表示的目标。

Aug, 2018

基于跨语料库领域自适应的意大利老年人情感识别

本文旨在定义一个语音情感识别（SER）模型，能够在自然会话中识别意大利老年人的积极、中性和消极情绪。通过合并英语数据集和意大利语数据集并采用 XGBoost 模型训练，提出了一种适用于多个语种和多个年龄段的通用模型，并提出两种领域自适应策略来使模型适应老年人和意大利人。结果表明，这种方法提高了分类性能，同时也强调了需要收集新的数据集。

Nov, 2022

采用聚合语料库和深度多任务学习实现野外情感识别语音

使用多任务学习以及在深度神经网络中使用性别和自然度等辅助任务来改善情感模型的泛化能力，并在理论模拟和实际数据中比较了单任务学习方法，结果表明多任务学习方法显著提高了情感识别性能，尤其是使用性别和自然度都提高了性能。

Aug, 2017

基于深度学习的情感识别数据增强技术比较研究

本文对情感识别中的流行深度学习方法进行了全面评估，发现语音信号中的长距离依赖对情感识别至关重要，而速率变换是获得最稳健性能提升的最佳数据扩增技术之一。

Nov, 2022

建立一个包含表达和经验情感标注的对话语料库

本文介绍了一种使用两种不同情绪注释的对话语料库构建方法，并讨论了该方法在日语对话语料库上的效果。研究结果表明，辨别说话者和听话者情绪有困难，使用多任务学习可以提高情绪辨识能力。

May, 2022

利用跨领域语音情感识别协助，使用无标记情感数据集进行情感可控语音合成

本文提出了一种新颖的情感文本转语音合成方法，通过跨域语音情感识别模型和情感文本转语音模型进行联合训练，从而在不需要情感标签的 TTS 数据集上生成具有情感表现力的语音，并且几乎不影响其语音质量。

Oct, 2020

GoodNewsEveryone：一份新闻标题语料库，涵盖情感、语义角色和读者感知的注释

通过众包的方式，我们发布了一个数据集，包括了 5000 个英文新闻标题的情感、情感体验者和文本线索、相关情感原因和目标，以及读者对标题情感的感知；在此基础上，我们提出了一个多阶段的注释程序，开发了语义角色结构自动预测任务的基线，并讨论了结果，此数据集支持进一步情感分类、情感强度预测、情感原因检验和定性研究。

Dec, 2019

利用心理语言学特征和 Transformer 提升基于文本的情感检测的泛化能力

本文采用基于转换器模型和双向 LSTM 网络的方法，结合心理语言学特征进行基于文本的情感检测，在两个基准数据集中表现出可比性，在六个统一情感数据集的迁移学习实验中表现出强大的跨领域泛化功能。

Dec, 2022

使用高级音频和文本特征的多模态情感识别

本篇研究提出一个基于深度学习和跨媒介表征学习的情感识别方法，该方法融合了文字和语音特征，并通过评估发现其在 IEMOCAP 数据集上表现优于其它方法。

Sep, 2021