Jan, 2024
高精度语音搜索查询纠错通过可检索的语音 - 文本嵌入
High-precision Voice Search Query Correction via Retrievable Speech-text Embedings
Christopher Li, Gary Wang, Kyle Kastner, Heng Su, Allen Chen...
TL;DR通过使用多模式语音文本嵌入网络,从语音文本数据库中直接查询校正候选项,以消除音频 - 假设不匹配问题,并在将候选项添加到原始候选列表之前使用语音 - 文本嵌入距离对候选项进行评分,该方法在改善检索率的同时,降低了相对的词错误率(WER)。