Jun, 2024

音频 - 文本检索中的语言沟通

TL;DR通过使用多语言文本编码器编码文本数据,结合一致集成蒸馏优化音频编码器,我们的方法在英语语音文本检索方面表现出最先进的性能,并且仅使用额外的 10%的语言增强训练数据,也能有效检索其他七种语言的内容。