Sep, 2023

AV-CPL: 面向音视频语音识别的连续伪标记

TL;DR通过连续的伪标签生成解决了音频 - 视觉语音识别的半监督训练问题,同时提高了视觉语音识别性能并保持了实用性。