Aug, 2023

HuBo-VLM:为人机交互任务设计的统一视觉语言模型

TL;DR本文提出了一种基于统一变压器视觉语言模型的 HuBo-VLM 方法,用于解决与人机交互相关的感知任务,包括物体检测和视觉定位,丰富的实验表明了该方法的有效性。