Feb, 2023

面向说话者自适应视觉语音识别的深度神经网络提示调整

TL;DR本文提出了一种基于 Deep Neural Networks 的 prompt tuning 方法,通过针对目标演讲者的适应数据进行提示微调,显著提高了预先训练的 Visual Speech Recognition 模型在未知演讲者上的性能。