Nov, 2023

图卢兹高光谱数据集:用于评估半监督光谱表示学习和像素级分类技术的基准数据集

TL;DR通过空中高光谱图像,利用具有极高空间和光谱分辨率以及覆盖广泛光谱领域的特点,进行大型城市地表覆盖的绘制。然而,由于训练数据的有限性,利用现有机器学习算法对地表覆盖进行绘制的能力受到了严重限制。针对标记数据的稀缺性,半监督和自监督技术引起了社区的广泛关注。因此,我们在本文中发布了 Toulouse Hyperspectral 数据集,以满足光谱表示学习和大规模高光谱图像分类中的关键问题。此外,我们讨论和实验了 Masked Autoencoders 的自监督任务,并建立了一个基于常规自编码器与随机森林分类器相结合的像素级分类基线,实现 82%的总体准确性和 74%的 F1 得分。