Apr, 2024
基于扩散的视觉感知中的隐式和显式语言指导
Implicit and Explicit Language Guidance for Diffusion-based Visual Perception
Hefeng Wang, Jiale Cao, Jin Xie, Aiping Yang, Yanwei Pang
TL;DR本研究介绍了一种基于隐式和显式语言引导的 IGDP 扩散感知框架,利用大规模视觉 - 语言预训练实现高质量图像生成,同时在语义分割和深度估计等感知任务上取得了有希望的性能。