BriefGPT.xyz
Ask
alpha
关键词
multi-modal system
搜索结果 - 3
多任务多模态预测分类和维度情感
多任务学习在语音情绪识别中的应用与多模态系统和情绪范畴及情绪维度的预测相关,通过跨任务正则化和特征融合提高模型表现。
PDF
6 months ago
M2-CTTS: 端到端的多尺度、多模态会话文本到语音合成
提出了一种多尺度,多模态会话文本到语音系统(M2-CTTS),用于综合利用历史会话并增强韵律表达,通过考虑文本和声学因素的粗粒度和细粒度建模,并混合细粒度上下文信息及声学特征,实现了更好的韵律表现和自然度。
PDF
a year ago
分析 PECNet 的鲁棒性
本文介绍了用于自动驾驶车辆的行人轨迹预测系统 PECNet 的全面健壮性分析,使用从牛顿力学到基于深度强化学习的模拟的合成数据增强技术来提高和测试系统,提出了一种新的度量标准来进行数据集分析和分类,并在采用 SIRENs 的新体系结构的情况
→
PDF
2 years ago
Prev
Next