May, 2024

利用领域知识探索UMAP投影的镜头函数

TL;DR基于Mapper和STAD的灵感,本文针对UMAP提出了三种类型的镜头函数,用于领域知识引导的交互式探索,以实现将高维数据投影到二维空间并显示隐藏模式的目的。通过使用镜头函数,分析人员可以根据问题调整投影,揭示不可见的模式,并通过筛选连接性来探索手动选择的特征与数据结构之间的相互作用,从而创造可能揭示新见解的可配置视角。本文在两个使用案例中展示了镜头函数的有效性,并在合成基准测试中分析了它们的计算成本。