Sep, 2024

HVT: 一种用于非欧几里得空间学习的综合视觉框架

TL;DR本研究解决了在非欧几里得空间中数据表示的不足,提出了一种新的超曲面视觉变换器(HVT),利用超曲几何改进自注意力机制,从而更有效地建模图像数据中的层次和关系依赖性。研究表明,该方法在图像分类任务上,尤其是在ImageNet数据集上,表现出更好的性能。