Oct, 2022

文本和语音嵌入匹配:探索基于迁移学习的语音检索策略

TL;DR本文研究了预训练的深度学习模型在跨模态(文字到音频)检索中的应用,使用浅层神经网络将提取的嵌入映射到公共维度,并探究优化模型的先前培训方法和损失函数选择的重要性。