BriefGPT.xyz
Ask
alpha
关键词
affordance properties
搜索结果 - 3
CVPR
SUGAR: 为机器人预训练 3D 视觉表征
通过名称为 SUGAR 的新型 3D 预训练框架,可以捕捉物体的语义、几何和功能属性,解决了处理复杂 3D 场景中的遮挡和准确定位对象的亚优缺陷;SUGAR 利用可变转换模型同时处理五个预训练任务,包括语义学习的跨模态知识蒸馏、理解几何结构
→
PDF
3 months ago
ACL
基于因果动作 - 效应建模的视频领域隐式便利性获取
通过自我监督预训练方法,从视觉领域获取行动效果相关的可供性知识,进而证实在学习可供性特性方面,基于行动模式和效果模式的双重预训练任务比基于图像的视觉 - 语言模型以及纯语言模型更为有效。
PDF
7 months ago
循环双向交互的基于短语的可供性检测
本文提出了一种基于视觉 - 语言角度的,循环双边一致性增强网络(CBCE-Net)来检测与对象互动的可能性,通过对公开的 Purpose-driven Affordance Dataset (PAD) 进行扩展,使用短语注释了能力类别。实验
→
PDF
2 years ago
Prev
Next