Jun, 2023

一种基于多Cuer语料库的适用于提示性语言重同步的新型可解释且具有泛化能力的模型

TL;DR本文介绍一种将唇读与手势结合的多模式视觉编码系统——Cued Speech(CS),并在此基础上提出了一种利用统计测量方法的可解释通用模型来预测手先时间(HPT)的方法。此外,对五位说话人的视频进行了注释,并发现手先现象存在于它们的产生中,同时也证明了方法的有效性。