May, 2023

基于度量学习改善正常与无声语音间的视觉语音识别差距

TL;DR本文提出一种基于 visemes 的度量学习方法,解决了视觉语音识别中正常与无声语音的表现差距问题,通过最小化预测 viseme 概率分布之间和内部的 Kullback-Leibler 散度,有效地学习和预测 viseme 身份。