May, 2024

基于概率分布建模的不确定性感知手语视频检索

TL;DR提出了一种新的基于不确定性感知的概率分布检索 (UPRet) 方法,以概率分布的形式理解手语视频和文本之间的映射过程,并探索它们的潜在相互关系,实现了灵活的映射。在三个基准测试上进行的实验展示了我们方法的有效性,分别在 How2Sign (59.1%)、PHOENIX-2014T (72.0%) 和 CSL-Daily (78.4%) 上取得了最先进的结果。