nEMO：波兰情感语音数据集

COLINGApr, 2024

nEMO: Dataset of Emotional Speech in Polish

Iwona Christop

TL;DR该研究介绍了 nEMO，一个包含波兰语情感语音的新型语料库，它由参演的九名演员录制的三个多小时的样本组成，描绘了六种情感状态：愤怒、恐惧、快乐、悲伤、惊讶和中性状态。

Abstract

speech emotion recognition has become increasingly important in recent years due to its potential applications in healthcare, customer service, and personalization of dialogue systems. However, a major issue in this field is the lack of →

speech emotion recognition datasets emotional speech polish language nemo

发现论文，激发创造

BANSpEmo：孟加拉语情感语音识别数据集

在音频和语音分析领域，从声音信号中识别情绪是关键的。我们介绍了 BanSpEmo，这是一个仅包含音频录音的情感语音语料库，专门用于孟加拉语。该语料库包含 792 个音频录音，持续时间超过 1 小时 23 分钟。22 名本地说话者参与了两组代表六种期望情绪的句子录制。该数据集由 12 个孟加拉语句子组成，以 6 种情绪（厌恶、快乐、悲伤、惊讶、愤怒和恐惧）进行表达。BanSpEmo 是一个有用的资源，可以促进孟加拉语情绪和语音识别研究以及相关应用的发展。该数据集可在此处找到：此 https 网址，并可用于学术研究。

Dec, 2023

EMOVIE：一种普通话情感语音数据集及其简单情感文本转语音模型

本篇论文提供了包括 9,724 个样本的情感语音数据集，并提出了一种名为 EMSpeech 的情感语音合成模型，该模型无需参考音频即可从文本预测情感标签并生成更富表现力的语音。在实验中，作者验证了数据集的有效性，证明了该模型在情感语音合成任务中取得了显著性能。

Jun, 2021

自然对话中连续情感识别的多模态传感器数据集 K-EmoCon

本文介绍了 K-EmoCon 数据集，该数据集支持从多个角度评估社交互动中的持续情感，并包括音频 / 视觉记录、EEG 和外围生理信号等多模态测量。

May, 2020

EMNS /Imz/ Corpus: 游戏、电视和图像小说叙事中感情色彩丰富的单一演讲者数据集

本文介绍了情感化叙事语料库 (EMNS) 数据集的构建，该数据集包含高质量的英式英语语音，具有标记的话语，可增强动态和表现性语言的交互式体验。该数据集提供了更高质量和清洁的录音，以帮助更自然和表现性的语音合成技术用于交互式叙事驱动的体验，同时还公开了远程和可扩展的数据收集系统供研究社区使用。

May, 2023

希腊戏剧演出中语音情感识别数据集

本研究介绍了一个新的，用于识别希腊话剧中情感的公共数据集 GreThE，并通过各种机器和深度学习框架以及一些在情感识别领域中广泛使用的数据库的实验结果来讨论该分类技术。通过在希腊话剧中获取多个讲话记录并进行多人注释，最终生成了真实情感分类数据。

Mar, 2022

一项关于语音情感识别的跨语料库研究

研究了通过跨语料库和多领域训练，分类自然和表演情感的影响；结论表明，从人工情感数据集中学习信息并将其应用于多领域的自然情感识别中是可行和有效的。

Jul, 2022

MELD-ST：一种情感感知的语音翻译数据集

本文强调在语音翻译中考虑情感的重要性，并介绍了 MELD-ST 数据集，该数据集用于情感感知的语音翻译任务，包括英至日和英至德语言对。每个语言对都包含约 10,000 个用 MELD 数据集进行情感标注的话语。对数据集使用 SeamlessM4T 模型进行基线实验发现，在某些情况下，通过加入情感标签进行微调可以提高翻译性能，进一步突显了情感感知语音翻译系统需要进一步研究的重要性。

May, 2024

EmoInHindi：一份多标签带有情感和强度注释的印地语数据集，用于对话情感识别

本研究创建了一个巨大的印地语对话数据集 EmoInHindi，用于多标签情感和强度识别。研究着重于表达和识别上下文语境中的情感。

May, 2022

SER_AMPEL: 一个用于意大利老年人 SER 的多源数据集

本文介绍了 SER_AMPEL，一个用于意大利老年人语音情感识别（SER）的多源数据集。数据集的特点是根据不同的协议进行收集，特别考虑了从电影和电视剧中提取的演奏对话以及通过适当问题引发情感的自然对话。通过对提出的数据集的子集进行分类结果分析，报告了关于 SER 关键问题的初步考虑。

Nov, 2023

情绪语音信息库 (EMOVOME): 自发语音信息中的情绪识别

EMOVOME 是一个包含 999 条语音信息的数据集，来自 100 位西班牙使用者在即时消息应用上的真实对话，具有性别平衡。该数据集为野外环境下的情感表达提供了基线，包括语音特征和文字特征的情感识别模型的准确率评估。该资源对于野外情感识别的研究和西班牙语的自然、免费资源提供了重要贡献。

Feb, 2024