BriefGPT.xyz
Ask
alpha
关键词
instance perception
搜索结果 - 2
多模态人工智能系统中用于视觉指令建立的图形用户界面代理优化
该研究提出了一种名为 Search Instruction Coordinates(SIC)的多模态对象识别解决方案,可用于自主计算机视觉驱动的人工智能代理,通过自然语言指令和 GUI 截图定位指令在屏幕上执行的组件的坐标。研究开发了两种方
→
PDF
2 months ago
CVPR
通用实例感知作为物体发现和检索
本文提出了一个称之为 UNINEXT 的通用实例感知模型,它将各种实例感知任务重新制定为统一的对象发现和检索范式,并且可以灵活地通过更改输入提示来感知不同类型的对象。这个统一的公式带来了以下好处:(1) 可以利用来自不同任务和标签词汇的大量
→
PDF
a year ago
Prev
Next