May, 2022

DendroMap: 用Treemaps进行机器学习的大规模图像数据集的可视化探索

TL;DR本文提出了DendroMap这一新方法,可以有效地组织和交互式地探索大规模图像数据集,通过提取高维图像的层次聚类结构,用户可以在不同的抽象层级上对数据集进行总体分布的检查和兴趣区域的交互式缩放以及透视。研究结果表明,DendroMap可以帮助用户发现数据集和训练模型方面的见解,其效果优于t-SNE格子化版本,DendroMap已经在网站上提供。