Jun, 2023

朝着能够看见的语言模型:通过自然语言镜头看计算机视觉

TL;DRLENS 是一种模块化的方法,针对计算机视觉问题,利用大型语言模型进行推理,可以应用于零 / 少样本对象识别,以及视觉和语言问题。