BriefGPT.xyz
Ask
alpha
关键词
grounded world understanding
搜索结果 - 1
面向开放世界抓取的大规模视觉语言模型
通过结合语言模型 (vision-language models)、分割模型和抓取综合模型,提出了一个能够在任何场景中理解、规划和执行物体抓取的开放世界抓取系统 (OWG),通过视觉提示机制,借助于开放式自由语言的引导实现零样本应用,展示了
→
PDF
10 days ago
Prev
Next