Mar, 2024

使用 LLM 将标志识别转换为口语句子

TL;DR引入一种混合式 SLT 方法 Spotter+GPT,旨在从手语视频中生成口语句子,通过训练在语言手语数据集上的手语识别器和预训练的大型语言模型来提高 SLT 性能。