Dec, 2023
机器视觉治疗:多模态大型语言模型通过去噪上下文学习增强视觉鲁棒性
Machine Vision Therapy: Multimodal Large Language Models Can Enhance Visual Robustness via Denoising In-Context Learning
Zhuo Huang, Chang Liu, Yinpeng Dong, Hang Su, Shibao Zheng...
TL;DR我们提出了一种有效利用 MLLMs 进行机器视觉治疗的方法,通过与去噪标签进行微调,以无监督的方式提高学习模型的性能,并通过提出的 DICL 策略解决了 MLLMs 与视觉任务的兼容性问题。