- 音乐情感操控 -- 基于深度学习的交互视觉方法
我们介绍了一种使用 AI 工具来操纵歌曲情感内容的新方法。我们的目标是在尽可能保持原有旋律的情况下实现所需情感。为此,我们创建了一个交互式流程,能够将输入的歌曲转换为与之截然相反的情感,并通过 Russel 的 Circumplex 模型对 - 情感对话:赋能连贯表情、凝视和姿态生成的交流面孔
通过自我监督学习,我们提出了一个两阶段的音频驱动对话人物生成框架,利用 3D 面部特征点作为中间变量,以实现表情、注视和头部姿势的合作对齐,并映射到预训练模型中以生成高质量人脸图像。
- 评估计算机视觉模型的社会技术视角:基于性别和情绪检测与推理的案例研究
在计算机视觉技术的不断发展中,图像中性别和情绪的自动检测和解释是一个重要的研究领域。本文调查了计算机视觉模型中的社会偏见,并强调传统评估指标如精确度、召回率和准确率的局限性。我们的研究提出了一个社会技术框架,用于评估计算机视觉模型,同时结合 - ACLMELD-ST:一种情感感知的语音翻译数据集
本文强调在语音翻译中考虑情感的重要性,并介绍了 MELD-ST 数据集,该数据集用于情感感知的语音翻译任务,包括英至日和英至德语言对。每个语言对都包含约 10,000 个用 MELD 数据集进行情感标注的话语。对数据集使用 Seamless - SemEval-2024 任务 3:会话中的多模态情感因果分析
这篇论文概述了 SemEval-2024 任务 3 的目标,即从对话中提取所有情绪和其对应原因的对,并介绍了顶级团队的系统以及参与者的发现。
- ACL评估词汇融入对于抑郁症状估计的效果
探索将情感、情绪和领域特定的词表融入基于 Transformer 模型的抑郁症状估计中的影响。通过标记患者 - 治疗师对话的输入转录和社交媒体帖子中的单词来添加词表信息。总体结果表明,在预训练语言模型中引入外部知识可以提高预测性能,而不同的 - 超越标签:揭示语音情感识别数据集中的文本依赖性
通过检查专门数据集中的词汇重叠和机器学习模型的性能,我们揭示了特质标签中的显著文本依赖性,结果表明一些机器学习模型可能过多关注词汇特征而不是目标的语音特征,研究呼吁研究界重新评估现有数据集和方法论的可靠性,确保机器学习模型真正学到其设计的内 - 揭示讲话者嵌入中的情感聚类:对话音频情感识别的对比学习策略
研究表明说话者嵌入包含有关情感的有价值信息,因此在情感识别中,利用有限的标记数据,说话者嵌入有潜力成为一种有前途的资源。通过进行彻底的聚类分析,研究人员发现了情感与最先进的说话者嵌入之间的直接且有用的联系。为了利用这些信息,他们引入了一种新 - 情感感知的韵律短语化对表达性文本转语音
为了提高端到端文本转语音(TTS)的自然程度和可理解性,本文提出了一种情感感知的韵律短语模型(EmoPP),准确挖掘话语的情感线索并预测适当的短语断点,并通过客观和主观评估证明 EmoPP 在情感表达能力方面优于所有基线模型,取得了显著的性 - 推文中禁止阿富汗教育情感分析
本文介绍了首个情感标注达里语变体(阿富汗波斯语)数据集,LetHerLearn 数据集包含 7600 条推文,涉及 2012 年塔利班禁止妇女就读教育的反应。我们详细介绍了数据收集和注释过程,并展示了相关数据集统计以及对所得数据集的初始实验 - 基于量子概率的联合多模态讽刺、情感和情绪分析框架
本文提出一种基于量子概率的多模态讽刺、情感和情绪分析框架(QUIET),通过在两个数据集上进行大量实验,证明了 QUIET 与现有技术相比的有效性和优越性,并展示了量子概率在多情感分析中的巨大潜力。
- 情感社交人形智能系统
本文提出了一种智能虚拟助手,可通过情感语义解释人类语音情感, 并且通过声音风格转移和人工生成方法生成特定情感的声波,使得与之互动的人有更好的体验。
- TieFake:标题 - 文本相似度和情感感知假新闻检测
文章提出了 TieFake 方法,利用 BERT 和 ResNeSt 进行生成文字和图像的表示,采用 publisher 情感提取器捕获新闻内容中作者的主观情感,并提出了一个数字点积注意机制来捕获标题特征与文字特征之间的相似性,用于检测社交 - 无处可藏:双重深度交互通道网络基于数据增强用于假新闻检测
本篇论文提出了一种基于语义、情感和数据增强的小样本下假新闻检测方法,并引入情感演进模式和双深度交互通道网络,同时设计数据增强模块提高模型性能。实验证明该方法优于现有方法。
- 认知架构中的情感:与人类情感交互中的新兴属性
本文介绍如何在计算认知结构中表达情感,并着重讨论了情感新兴属性方面的相互作用研究,得出使用认知式人机交互方法能准确表达人类内部状态和过程的优势结论。
- 基于情感、年龄和种族的音乐推荐系统
使用 FER-2013 和 “年龄、性别和种族(面部数据)CSV” 数据集,基于情感、年龄和种族开发了一种音乐推荐系统,并使用 CNN 架构对模型进行了训练,训练了 3 个不同的模型,用于为用户推荐具有功能性和用户友好的音乐播放列表。
- 情感条件下的创意对话生成
本研究使用基于 DialGPT 的模型来生成具有情感色彩的创意性对话响应,针对不同情感如愤怒、厌恶、恐惧、快乐、疼痛、悲伤和惊讶,在输入句子和所需情感标签的条件下生成适当的响应,且具有 0.6 的情感准确度;在表达情感强度方面,愤怒、恐惧和 - Sonus Texere! 使用电影改编自动构建书籍的紧凑音轨
本文提出了一种全自动建立小说配乐的方法,该方法可以在阅读过程中播放高质量的配乐,通过文本处理和音乐编织管道识别章节中的情境和情感分布,并从小说的电影改编配乐中识别和播放相关片段。
- MM情感词汇表的创建和使用最佳实践
本文介绍了情感计算和 AI 伦理学的想法,旨在呈现有关情感词汇表创建和使用的实践和伦理考虑事项 —— 最佳实践。该目标是提供全面的相关考虑因素,以便读者(特别是那些新于情感处理的人)可以在一个地方找到相关信息。 我们希望这项工作将促进更多思 - ACL通过多任务学习在开放域对话中选择贴纸
该论文介绍了一种多任务学习方法,其包含三个辅助任务,强化对话历史、情感和标签的语义理解。在挑战性数据集上的大量实验表明,该模型可以更好地组合多模态信息,并在强基线模型上实现显着更高的准确性。消融研究进一步验证了每个辅助任务的有效性。