Jun, 2023

多模态注意力融合在孟加拉语言音行为识别中的应用

TL;DR本文开发了一种多模态方法,结合 wav2vec2.0 和 MarianMT 模型,在 Bengali 语音语料库中使用多模态注意融合预测语音行为,并展示了该模型在语音任务中的优越性能。