BriefGPT.xyz
Ask
alpha
关键词
egocentric datasets
搜索结果 - 3
3D-MVP:用于机器人操纵的三维多视角预训练
提出了 3D-MVP,一种使用遮罩自编码器进行 3D 多视图预训练的新方法,通过在大规模 3D 数据集上使用遮罩自编码器对其视觉编码器进行预训练,评估了其在虚拟机器人操作任务中的性能并展示了超过基线的改进,同时在实际机器人平台上也取得了令人
→
PDF
10 days ago
LEGO: 通过视觉指导调整学习自我中心动作帧生成
从以自身为中心的视角生成人类日常行为的指导性图像是有效的技能传递的一个关键步骤。本文提出了一个新颖的问题 —— 以自身为中心的动作帧生成。目标是根据用户提示问题和捕捉用户环境的输入自身中心图像,合成动作帧。值得注意的是,现有的自身中心数据集
→
PDF
7 months ago
CVPR
多模态空间校正器实现自我中心场景理解
本文提出了一种多模态空间矫正器解决自我中心图像中景深和表面法线预测的挑战,同时提出了一个新的数据集 EDINA 并使用多模态空间矫正器进行单视角深度和表面法线预测,在常见的自我中心图像数据集上优于基准模型。
PDF
2 years ago
Prev
Next