Jun, 2024

CNVSRC 2023:首届中国连续视觉语音识别挑战

TL;DR第一次的中国连续视觉语音识别挑战旨在评估大词汇量连续视觉语音识别在两个任务上的性能:(1)针对特定说话人的单一说话人语音识别和(2)针对一组已注册说话人的多说话人语音识别。此次挑战取得了非常成功的结果,最佳提交结果明显优于基准,尤其是在单一说话人任务中。本文全面回顾了这个挑战,包括数据概况、任务规范和基准系统的构建。同时,它总结了参赛系统所采用的代表性技术,并突出了最有效的方法。有关此挑战的更多信息和资源可通过官方网站访问此 http URL。