Apr, 2024

基于扩散的视觉感知中的隐式和显式语言指导

TL;DR本研究介绍了一种基于隐式和显式语言引导的 IGDP 扩散感知框架,利用大规模视觉 - 语言预训练实现高质量图像生成,同时在语义分割和深度估计等感知任务上取得了有希望的性能。