BriefGPT.xyz
Ask
alpha
关键词
scene layout
搜索结果 - 4
分而治之:语言模型可用于规划和自我纠正组合式文本到图像生成
我们提出了 CompAgent,这是一种无需训练的组合文本到图像生成方法,核心是一个大型语言模型代理。我们的方法在复杂的文本提示下能够保持对图像的可控性,尤其是在保留对象属性和关系方面,通过先将文本提示分解成独立的对象、属性和场景布局,并引
→
PDF
5 months ago
ICCV
注意力调制下的密集文本到图像生成
通过 DenseDiffusion 方法,我们能够在不需额外微调或数据集的情况下,有效改善给定密集描述的图像生成性能,并且达到与专门训练有场景布局条件的模型相似的视觉效果。
PDF
10 months ago
CVPR
使用隐式表示从单张图像中全面理解三维场景
本文提出了一种基于单幅图像的全面三维场景理解的新管道,该管道可以预测物体形状、物体姿态和场景布局,利用最新的深度隐式表示方法解决了物体形状和布局的不精确估计的问题,通过物理违规损失函数避免了物体之间的错误场景。实验结果表明,该方法在物体形状
→
PDF
3 years ago
ICCV
基于对象的单图多层场景分解
本文提出了一种从单张 RGB 图像中建立分层深度图像的方法,其具有自适应层数和语义编码,特别适用于处理遮挡物体的准确性和重建三维场景。
PDF
5 years ago
Prev
Next