CVPRJan, 2022

使用自由形式的文本查询进行手语视频检索

TL;DR本文介绍了一种通过迭代学习的 SPOT-ALIGN 框架来改善印式手语检索与识别的效果,该框架利用大规模的美式手语数据集 How2Sign,使用交叉模态嵌入技术以及自由文本查询来挖掘手语视频集合并且解决标注数据不足的问题。