cross-view attention | BriefGPT

关键词cross-view attention

搜索结果 - 4

多多 CLIP：多视图图像下的高效三维理解
推出了 Duoduo CLIP 模型，用于从多视图图像中学习形状表示，相比基于点云的方法，它展示了更好的泛化性能、减少的 GPU 要求和训练时间，以及利用多帧对象的交叉视图注意力进一步提升的性能。多视图图像还提供了与基于点云方法相比更大的灵
PDF17 days ago
CVTGAD: 跨视图关注的简化 Transformer 用于无监督图级异常检测
提出了一种新颖的基于简化 Transformer 和跨视图注意力的无监督图级异常检测方法 CVTGAD，通过构建简化 Transformer 模块和设计跨视图注意力机制，实现了图神经网络和 Transformer 的协同工作，大幅提升了异常
PDF2 months ago
ICCV神经辐射场的多任务视图合成
多任务视觉学习的创新问题设置，将多任务预测重新解释为多个新视角综合任务，使用 MuvieNeRF 框架同时综合多个场景属性，通过 Cross-Task Attention 和 Cross-View Attention 模块实现对多个视角和任
PDF9 months ago
通过遮蔽图像建模实现更好的三维知识转移，用于多视角三维理解
本文提出了一种名为 GeoMIM 的多相机视觉转换器，通过预训练 - 微调的方法将 LiDAR BEV 模型的知识传递给 GeoMIM，以改善多视图基于相机的三维检测，并在 nuscenes 基准测试中取得了最新的表现。
PDFa year ago