自监督学习方法综述:提高多模态表示学习的有效性
本综述论文介绍了自监督多模态学习(SSML)的现状和最新进展,对其目标函数、数据对准和模型架构三个方面进行分类,讨论了训练期间的多模态输入数据配对和对准策略,并回顾了用于图像文本和多模态视频的顶尖模型的具体表现及其在医疗保健、遥感和机器翻译等领域的实际应用。
Mar, 2023
本文总结了一些具有里程碑意义的研究论文,直接或间接地构建了当今多模态自我监督学习的基础。该文章回顾了过去几年中用于每种模态的表示学习的发展情况,以及它们如何组合成多模态智能体。
Nov, 2022
本文设计了一个基于自监督学习策略的标签生成模块,通过联合训练多模态和单模态任务来分别学习一致性和差异,采用权重调整策略来平衡不同子任务的学习进度,验证了自动生成的单模态监督标签的可靠性和稳定性,超过了现有的最先进方法和人工注释的单模态标签。
Feb, 2021
该论文提出了一种利用多个成像模式的新型自监督方法,设计了一个多模式拼图任务以促进多种图像模式的特征表征,提出了一种利用跨模态生成技术进行多模态数据增强的方法,实验表明该方法能够提高数据效率和语义表征,广泛应用于四种不同的下游任务,并取得了领先的成果。
Dec, 2019
本篇综述论文讨论了自监督学习在视频领域的应用,主要归纳了四种不同的自监督学习方法,分别为预测任务、生成式学习、对比学习和跨模态协议,并讨论了现有方法的局限性和未来发展方向。
Jun, 2022
本文提出了一个自监督训练框架,通过在训练管道中增加多模态聚类步骤以捕捉跨模态的语义相似性,进而学习一个共同的多模态嵌入空间,并证明其能在文本到视频检索和时间动作定位等两个具有挑战性的领域展示出四个不同数据集上的最新成果.
Apr, 2021
本文介绍自监督学习作为深度学习替代方案的优势及其在计算机视觉、自然语言处理和图学习中的应用,分类总结了现有的自监督学习方法,并进一步探讨其相关的理论分析工作,最后简要讨论了自监督学习的未来方向和开放性问题.
Jun, 2020