关键词acoustic-prosodic features
搜索结果 - 2
- 多模态信念预测
识别说话者对信仰的承诺水平是一项困难的任务;我们是第一个推断多模态信仰预测任务并展示结果的研究,使用了包含对齐文本和音频的说话者信仰标注的 CB-Prosody 语料库(CBP);我们报告了使用声学 - 韵律特征和传统机器学习方法的基线和显 - ACL语音解析:一种神经方法用于集成词汇和声学 - 韵律信息
本文中,我们提出了一个模型,该模型使用卷积神经网络对能量和音高轨迹进行耦合,并使用基于注意力机制的循环神经网络,接受文本和韵律特征,并结合转录文本和声学 - 韵律特征,以自动解析口语话语,并发现不同类型的声学 - 韵律特征都有助于解析,对比