May, 2023

视觉语音识别中的多时序唇音记忆

TL;DR本文提出了一种利用多时间点音频记忆的视觉语音识别方法,将音频信号与唇部运动相结合,实践证明此方法在两个公共视觉语音识别数据集上取得了最新技术表现。