Jul, 2023

基于语言的动作概念空间改进视频自监督学习

TL;DR使用自监督学习方法,对图像 CLIP 模型进行语言约束的调整,以适应视频领域,提高三个行动识别基准测试的零样本和线性探测性能。