远程感知中基于特征引导的遮罩自编码器实现自监督学习
提出了一种空间 - 光谱掩码自编码器 (SS-MAE) 用于高光谱成像和激光雷达 / 合成孔径雷达数据的联合分类,实现了空间和光谱表示的充分利用,并通过在训练阶段添加两个轻量级卷积神经网络来补充局部特征,成功在三个公开数据集上验证了 SS-MAE 相对于其他先进基线方法的优越性。
Nov, 2023
Fus-MAE is a self-supervised learning framework based on masked autoencoders that performs data fusion between synthetic aperture radar and multispectral optical data, effectively competing with contrastive learning strategies in SAR-optical data fusion.
Jan, 2024
通过使用遮蔽自动编码器(MAE)的卫星图像的预训练框架 SatMAE,我们结合时间嵌入和分组打包多光谱数据以提高预训练能力,进一步提高基准数据集上的监督学习性能(最高可达 7%),并在后续的遥感分类任务中表现出强大的转移学习能力(最高可达 14%)。
Jul, 2022
本文提出了一种 Semantic-Guided Masking 策略,通过引入语义部分将语义信息集成到 MAE 训练过程中,以学习更好的图像表示。该训练方法在各种视觉任务中都可以表现出色,特别是在 ImageNet-1k 中实现了 84.5% 的细调准确度,比基本 MAE 高 1.4%。
Jun, 2022
该论文提出了一种统一的自监督预训练框架,通过在神经辐射场 (NeRF) 中进行掩蔽多模态重建,实现可传输的多模态感知表示学习。实验证明,通过该方法学习到的表示对于多样化的三维感知下游任务(包括三维物体检测和 BEV 地图分割)具有良好的可迁移性,并且可享受掩蔽自编码器和神经辐射场机制的协同效应。
Nov, 2023
这篇论文介绍了一种用于可转移多模式表示学习的自监督预训练范式,利用 NeRF 支持的遮蔽自动编码器(NS-MAE)来提供高效且高性能的微调的预训练模型初始化,通过在神经辐射场(NeRF)中进行遮蔽多模式重建来训练模型以重建缺失或损坏的多模式输入数据,证明了 NS-MAE 表示在不同的多模式和单模式感知模型之间的良好可转移性,该可转移性在不同程度的微调标签数据下通过各种 3D 感知下游任务进行了评估,例如 3D 对象检测和 BEV 地图分割。
May, 2024
利用注重对象的重建过程来指导复原能力的建议,通过在损失函数中利用场景的注意力图获取的注意力图,提供更多的重建相关对象的强调,从而激励模型学习更加注重对象的表示,同时通过改进的线性探测和 k-NN 分类在几个基准测试中展示出我们预训练模型具有更好的潜在表示能力,同时使 ViTs 对不同背景更加稳健。
Feb, 2024
利用遥感数据构建了一个空间 - 时间 - 光谱结构化数据集(STSSD),并提出了一个新方法(A$^{2}$-MAE),通过预训练相互补充不同类型的遥感图像和地理信息来重构遮蔽补丁,实现了多种下游任务的全面改进。
Jun, 2024
遥感图像的自监督学习通过掩码自编码器(MAEs)近期吸引了广泛关注,该方法在内容基准图像检索(CBIR)方面具有重要潜力。然而,现有研究假设考虑的遥感图像是由单一图像传感器获取的,因此仅适用于单模态 CBIR 问题。本文首次探讨了 MAEs 在遥感领域跨传感器 CBIR 中的有效性,并针对多传感器遥感图像库提出了掩码图像建模的不同 CSMAE 模型,通过广泛的实验分析得出了利用掩码图像建模解决单模态和跨模态 CBIR 问题的指导方针。
Jan, 2024
本文提出了一种新的通过自编码集成原始音频数据的方法:Masked Spectrogram Modeling(MSM),并使用 Masked Autoencoders(MAE)进行自监督学习,这种方法在 HEAR 2021 NeurIPS Challenge 中取得了比传统方法更好的结果。
Apr, 2022