nEMO:波兰情感语音数据集
在音频和语音分析领域,从声音信号中识别情绪是关键的。我们介绍了 BanSpEmo,这是一个仅包含音频录音的情感语音语料库,专门用于孟加拉语。该语料库包含 792 个音频录音,持续时间超过 1 小时 23 分钟。22 名本地说话者参与了两组代表六种期望情绪的句子录制。该数据集由 12 个孟加拉语句子组成,以 6 种情绪(厌恶、快乐、悲伤、惊讶、愤怒和恐惧)进行表达。BanSpEmo 是一个有用的资源,可以促进孟加拉语情绪和语音识别研究以及相关应用的发展。该数据集可在此处找到:此 https 网址,并可用于学术研究。
Dec, 2023
本篇论文提供了包括 9,724 个样本的情感语音数据集,并提出了一种名为 EMSpeech 的情感语音合成模型,该模型无需参考音频即可从文本预测情感标签并生成更富表现力的语音。在实验中,作者验证了数据集的有效性,证明了该模型在情感语音合成任务中取得了显著性能。
Jun, 2021
本文介绍了 K-EmoCon 数据集,该数据集支持从多个角度评估社交互动中的持续情感,并包括音频 / 视觉记录、EEG 和外围生理信号等多模态测量。
May, 2020
本文介绍了情感化叙事语料库 (EMNS) 数据集的构建,该数据集包含高质量的英式英语语音,具有标记的话语,可增强动态和表现性语言的交互式体验。该数据集提供了更高质量和清洁的录音,以帮助更自然和表现性的语音合成技术用于交互式叙事驱动的体验,同时还公开了远程和可扩展的数据收集系统供研究社区使用。
May, 2023
本研究介绍了一个新的,用于识别希腊话剧中情感的公共数据集 GreThE,并通过各种机器和深度学习框架以及一些在情感识别领域中广泛使用的数据库的实验结果来讨论该分类技术。通过在希腊话剧中获取多个讲话记录并进行多人注释,最终生成了真实情感分类数据。
Mar, 2022
本文强调在语音翻译中考虑情感的重要性,并介绍了 MELD-ST 数据集,该数据集用于情感感知的语音翻译任务,包括英至日和英至德语言对。每个语言对都包含约 10,000 个用 MELD 数据集进行情感标注的话语。对数据集使用 SeamlessM4T 模型进行基线实验发现,在某些情况下,通过加入情感标签进行微调可以提高翻译性能,进一步突显了情感感知语音翻译系统需要进一步研究的重要性。
May, 2024
本研究创建了一个巨大的印地语对话数据集 EmoInHindi,用于多标签情感和强度识别。研究着重于表达和识别上下文语境中的情感。
May, 2022
本文介绍了 SER_AMPEL,一个用于意大利老年人语音情感识别(SER)的多源数据集。数据集的特点是根据不同的协议进行收集,特别考虑了从电影和电视剧中提取的演奏对话以及通过适当问题引发情感的自然对话。通过对提出的数据集的子集进行分类结果分析,报告了关于 SER 关键问题的初步考虑。
Nov, 2023
EMOVOME 是一个包含 999 条语音信息的数据集,来自 100 位西班牙使用者在即时消息应用上的真实对话,具有性别平衡。该数据集为野外环境下的情感表达提供了基线,包括语音特征和文字特征的情感识别模型的准确率评估。该资源对于野外情感识别的研究和西班牙语的自然、免费资源提供了重要贡献。
Feb, 2024