Jun, 2024

在级联流式语音翻译中导航机器翻译束搜索的雷区

TL;DR我们将广泛应用的波束搜索算法用于级联实时语音翻译系统,通过解决实时处理中的四个关键挑战以及提供比贪婪搜索更好的效果,如处理不完整的识别结果,减少用户感知延迟,处理不同长度和模型状态的波束搜索假设,处理句子边界,我们的方法将BLEU分数提升1点,将CPU时间减少40%,字符闪烁率降低20%以上。