Feb, 2023
面向说话者自适应视觉语音识别的深度神经网络提示调整
Prompt Tuning of Deep Neural Networks for Speaker-adaptive Visual Speech Recognition
Minsu Kim, Hyung-Il Kim, Yong Man Ro
TL;DR本文提出了一种基于 Deep Neural Networks 的 prompt tuning 方法,通过针对目标演讲者的适应数据进行提示微调,显著提高了预先训练的 Visual Speech Recognition 模型在未知演讲者上的性能。