BriefGPT.xyz
大模型
Ask
alpha
关键词
resource-constrained domains
搜索结果 - 1
多模态注意力融合用于提升语音识别和音频事件分类
使用自我监督目标进行大型基础模型的训练,然后在下游任务中进行微调已成为一种标准程序。我们介绍了多模态注意力融合(MAM)方法,通过零 - shot 范式,实现了从高资源模态(文本和图像)的注意力矩阵到资源受限领域(语音和音频)的知识转移。M
→
PDF
6 months ago
Prev
Next