CVPRMar, 2023

CVT-SLR: 对比视觉 - 文本变换及变分对齐应用于手语识别

TL;DR本文提出了一种新的对比视觉 - 文本转换(CVT-SLR)的方案,以充分探索视觉和语言模态的预训练知识,改进手语识别(SLR)的效果,实验结果表明其优于现有的单模态方法甚至优于 SOTA 多模态方法。