Nov, 2023

西班牙语连续唇读的视觉特征分析

TL;DR我们提出了一种分析不同语音视觉特征的方法,以确定哪种方法最适合捕捉西班牙语口唇运动的特性,并通过这种方式来处理自动视觉语音识别任务。在使用传统的基于隐马尔可夫模型和高斯混合模型的系统进行评估时,结果表明,在受限条件下,使用特征脸和深度特征的组合是最佳的视觉方法。