May, 2024

LM4LV:一个用于低级图像任务的冻结大型语言模型

TL;DR该研究论文提出了一种名为LM4LV的框架,它能够使冻结的大型语言模型(LLM)解决一系列的低层次视觉任务,展示了LLM在低层次视觉中的强大潜力,并且架起了MLLM和低层次视觉任务之间的桥梁。