May, 2023
基于度量学习改善正常与无声语音间的视觉语音识别差距
Improving the Gap in Visual Speech Recognition Between Normal and Silent Speech Based on Metric Learning
Sara Kashiwagi, Keitaro Tanaka, Qi Feng, Shigeo Morishima
TL;DR本文提出一种基于 visemes 的度量学习方法,解决了视觉语音识别中正常与无声语音的表现差距问题,通过最小化预测 viseme 概率分布之间和内部的 Kullback-Leibler 散度,有效地学习和预测 viseme 身份。