May, 2024

DEEM:扩散模型作为大型语言模型对图像感知的眼睛

TL;DR通过使用扩散模型的生成反馈来提高模型的鲁棒性,减少视觉幻觉,并且不需要额外的训练模块和更少的训练参数,DEEM 优于其他交替内容生成模型。