Jun, 2024

基于音频文本的关键词检测的关系代理损失

TL;DR通过引入关系型代理损失(RPL)的概念,利用声学嵌入和文本嵌入之间的关系结构,改进了现有方法,在华尔街日报(WSJ)语料库上展示了更好的性能。