Mar, 2023

自监督多模态学习:综述

TL;DR本综述论文介绍了自监督多模态学习(SSML)的现状和最新进展,对其目标函数、数据对准和模型架构三个方面进行分类,讨论了训练期间的多模态输入数据配对和对准策略,并回顾了用于图像文本和多模态视频的顶尖模型的具体表现及其在医疗保健、遥感和机器翻译等领域的实际应用。