关键词visual foundation model
搜索结果 - 3
- 基于 SAM 先验的多视角遥感图像分割
通过将可视化基础模型 Segment Anything(SAM)注入到隐式神经场模型 - INF 中,我们提出了一种新的多视图遥感图像分割方法,通过对测试视图和训练视图之间的 SAM 特征进行对比,得出每个测试视图的伪标签,从而增强整个场景 - Vision Mamba: 模型、应用和挑战综述
在这篇综述性文章中,我们回顾了 Mamba 模型的起源和核心见解,并将 Mamba 应用于不同的计算机视觉任务。我们对各种图像、视频、点云、多模态等应用进行了分类和组织,为未来在这个快速发展的领域中提供了挑战和研究方向。
- 通过反事实世界建模统一(机器)视觉
引入了反事实世界建模 (Counterfactual World Modeling) 框架,构建了一个视觉基础模型:一个统一的、无监督的网络,可以提示执行各种视觉计算,结果表明 CWM 是将机器视觉的众多技术统一起来的一种很有前途的途径。