Nov, 2023

朝着利用大型语言模型进行开放式视觉识别

TL;DR本文介绍了 OmniScient 模型(OSM)作为解决物体本地化和识别的挑战的一种新颖的基于大型语言模型(LLM)的掩模分类器,通过以生成方式预测类标签,并在没有人为干预的情况下实现跨数据集训练,并展示了其在处理新概念中的有效性。