Jun, 2023
朝着能够看见的语言模型:通过自然语言镜头看计算机视觉
Towards Language Models That Can See: Computer Vision Through the LENS of Natural Language
William Berrios, Gautam Mittal, Tristan Thrush, Douwe Kiela, Amanpreet Singh
TL;DRLENS 是一种模块化的方法,针对计算机视觉问题,利用大型语言模型进行推理,可以应用于零 / 少样本对象识别,以及视觉和语言问题。