关键词multimodal self-supervised learning
搜索结果 - 3
- DeCUR: 多模态自监督中的公共和独特表达解耦
通过多传感器数据的多模态自我监督学习,提出了一种区分共有和独特表示的方法(Decoupling Common and Unique Representations,DeCUR),在场景分类和语义分割的下游任务中展现出一致的优势。
- 使用跨模态知识挖掘的对比学习进行多模态人体活动识别
本文提出了一个名为 CMC-CMKM 的多模态自监督学习框架,可以学习到更好的人体活动识别特征。在两个广泛使用的数据集上进行的广泛实验表明,该框架在不同场景下的性能显著优于对比单模态和多模态基线,在有些情况下甚至可以与监督方法相竞争。
- ICCV用于自监督学习的多模聚类网络:来自无标签视频
本文提出了一个自监督训练框架,通过在训练管道中增加多模态聚类步骤以捕捉跨模态的语义相似性,进而学习一个共同的多模态嵌入空间,并证明其能在文本到视频检索和时间动作定位等两个具有挑战性的领域展示出四个不同数据集上的最新成果.