May, 2024

模拟学者:具有图像扩散模型的即刻视觉环境学习

TL;DR通过使用在图像修复中预训练的文本到图像扩散模型,我们提出了 Analogist 作为一种新颖的推理型视觉上下文学习方法,旨在利用视觉和文本提示技术,提高任务的泛化能力和上下文感知能力,从而在各种视觉任务中取得优越性能。