May, 2024
DEEM:扩散模型作为大型语言模型对图像感知的眼睛
DEEM: Diffusion Models Serve as the Eyes of Large Language Models for Image Perception
Run Luo, Yunshui Li, Longze Chen, Wanwei He, Ting-En Lin...
TL;DR通过使用扩散模型的生成反馈来提高模型的鲁棒性,减少视觉幻觉,并且不需要额外的训练模块和更少的训练参数,DEEM 优于其他交替内容生成模型。