BriefGPT.xyz
大模型
Ask
alpha
关键词
cross-view attention
搜索结果 - 4
多多 CLIP:多视图图像下的高效三维理解
推出了 Duoduo CLIP 模型,用于从多视图图像中学习形状表示,相比基于点云的方法,它展示了更好的泛化性能、减少的 GPU 要求和训练时间,以及利用多帧对象的交叉视图注意力进一步提升的性能。多视图图像还提供了与基于点云方法相比更大的灵
→
PDF
17 days ago
CVTGAD: 跨视图关注的简化 Transformer 用于无监督图级异常检测
提出了一种新颖的基于简化 Transformer 和跨视图注意力的无监督图级异常检测方法 CVTGAD,通过构建简化 Transformer 模块和设计跨视图注意力机制,实现了图神经网络和 Transformer 的协同工作,大幅提升了异常
→
PDF
2 months ago
ICCV
神经辐射场的多任务视图合成
多任务视觉学习的创新问题设置,将多任务预测重新解释为多个新视角综合任务,使用 MuvieNeRF 框架同时综合多个场景属性,通过 Cross-Task Attention 和 Cross-View Attention 模块实现对多个视角和任
→
PDF
9 months ago
通过遮蔽图像建模实现更好的三维知识转移,用于多视角三维理解
本文提出了一种名为 GeoMIM 的多相机视觉转换器,通过预训练 - 微调的方法将 LiDAR BEV 模型的知识传递给 GeoMIM,以改善多视图基于相机的三维检测,并在 nuscenes 基准测试中取得了最新的表现。
PDF
a year ago
Prev
Next