BriefGPT.xyz
Ask
alpha
关键词
multimodal conversation
搜索结果 - 2
多模态对话中情感和意图的联合理解:一个基准数据集
描述了一种旨在解码多模态对话历史中的语义信息,同时推断出当前话语的情感和意图的技术,即多模态对话中情感和意图联合理解 (MC-EIU),并提出了 MC-EIU 数据集,此数据集包括 7 个情感类别、9 个意图类别、3 种模态 (文本、声学和
→
PDF
7 days ago
视觉感知的文本转语音
本文提出了一种新的视觉感知文本转语音(VA-TTS)任务,它可以根据面对面交流中听者的语音和面部表情条件语音的生成,实验表明该方法可以在多种情景下生成更加自然有节奏感的音频。
PDF
a year ago
Prev
Next