情感语调在神经机器翻译中的实用性

Apr, 2024

情感语调在神经机器翻译中的实用性

Usefulness of Emotional Prosody in Neural Machine Translation

Charles Brazier, Jean-Luc Rouas

TL;DR通过将语音情感信息集成到神经机器翻译系统中，可以提高翻译质量。

Abstract

neural machine translation (NMT) is the task of translating a text from one language to another with the use of a trained neural network. Several existing works aim at incorporating external information into NMT

neural machine translation external information emotion recognition speech emotion recognition translation quality

发现论文，激发创造

利用语音 PTM、文本 LLM 和情感 TTS 进行语音情感识别

通过研究不同的预训练模型、情感文本合成和数据增强方法，本文提出了一种提高语音情感识别效果的方法，实验结果表明该方法在 IEMOCAP 数据集上具有较高的效果。

Sep, 2023

机器之间的机器翻译：情感分类应用案例

提出了一种神经机器翻译的方法，利用一种新的候选采样策略，基于强化学习技术提高翻译模型的机器导向性，从而产生最适合用作特定下游任务的自然语言处理组件输入的翻译结果，这种方法可以显著提高英文分类器对 Twitter 数据的情感分类的性能。

Oct, 2019

采用聚合语料库和深度多任务学习实现野外情感识别语音

使用多任务学习以及在深度神经网络中使用性别和自然度等辅助任务来改善情感模型的泛化能力，并在理论模拟和实际数据中比较了单任务学习方法，结果表明多任务学习方法显著提高了情感识别性能，尤其是使用性别和自然度都提高了性能。

Aug, 2017

利用自然语言提示控制语音合成中的情感

我们提出了一种通过由情感丰富的文本衍生出的嵌入来作为提示信息的系统，通过在基于 Transformer 的架构内多次集成发言者和提示信息的联合表示。我们的方法在合并情感语音和文本数据集上进行训练，并在每次训练迭代中变化提示信息，以增加模型的泛化能力。客观和主观评估结果表明，该条件合成系统能够准确地将提示中的情感转移到语音中。同时，保持了发言者身份的精确可追踪性以及整体的高话语质量和可理解性。

Jun, 2024

时间建模至关重要：一种新的面向语音情感识别的时间情感建模方法

本文介绍了一种基于时间的情感建模方法，称为 TIM-Net，它学习来自各种时间尺度的多尺度情境情感表示，并用于提高语音情感识别的性能，实验结果表明 TIM-Net 在六个基准数据集上表现出优异的性能。

Nov, 2022

评估汉英情感微博文本机器翻译：一份用于情感翻译质量评估的人工标注数据集

本文关注机器翻译对情感文本的翻译表现，并通过提出的基于多维质量度量的评估框架，对谷歌翻译的输出进行评估。作者发现大约 50% 的机器翻译输出没有保留原始情感，并认为情感承载词和语言现象是这些翻译错误的常见原因。

Jun, 2023

多门机制与神经架构搜索的多语言语音情感识别

本文针对低资源语言，提出了一种语言特定的多预训练语音模型情感信息提取方法，设计了一种多领域模型，采用多门机制，并通过神经网络结构搜索模块为每种语言寻找特定的神经网络结构，并引入对比辅助损失来构建更可分离的音频数据表示。实验表明，该模型为德语和法语提高了 3％和 14.3％的准确率。

Oct, 2022

利用语音和文本的多模态语音情感识别

本文提出了一种深度双重循环编码器模型，利用语音和文本数据进行机器情感识别，该模型表现更优，实验结果显示，当将该模型应用于 IEMOCAP 数据集时，在将数据分配到四个情感类别（愤怒，高兴，悲伤和中性）方面，准确率在 68.8％至 71.8％之间。

Oct, 2018

语音情感识别的实证研究与改进

本文提出了一种通过视角损失来改进的多模态语音情感识别模型，通过融合音频和文本信息来提高多模态任务的性能表现，在 IEMOCAP 数据集上获得了最新的最佳表现。

Apr, 2023

利用语音情感识别和推荐系统处理治疗聊天机器人中的负面情绪

提出了一种通过增强语音感知能力来提升治疗聊天机器人对用户情绪理解和人性化回应的方法，该方法使用卷积神经网络（CNN）模型和 ShEMO 数据集的语音情感识别（SER）技术来准确检测和分类负面情绪，包括愤怒、恐惧和悲伤，并使用 SER 模型和 GloVe、LSTM 模型相结合的推荐系统生成个性化管理负面情绪的建议，同时将 GlowTTS 文本到语音模型整合到一起，使治疗聊天机器人能够用英语和波斯语将生成的建议以声音形式传达给用户，最终提高了英语和波斯语用户心理健康支持的交付效果。

Nov, 2023