Jun, 2023
多模态注意力融合在孟加拉语言音行为识别中的应用
BeAts: Bengali Speech Acts Recognition using Multimodal Attention Fusion
Ahana Deb, Sayan Nag, Ayan Mahapatra, Soumitri Chattopadhyay, Aritra Marik...
TL;DR本文开发了一种多模态方法,结合 wav2vec2.0 和 MarianMT 模型,在 Bengali 语音语料库中使用多模态注意融合预测语音行为,并展示了该模型在语音任务中的优越性能。