BriefGPT.xyz
Ask
alpha
关键词
text description
搜索结果 - 3
CrossGLG: LLM 以跨层级方式指导一次性基于骨架的 3D 动作识别
通过大型语言模型生成的文本描述,全局 - 局部 - 全局方式指导特征学习,设计了双分支架构,提高单次骨架动作识别的准确性和推理效率。
PDF
4 months ago
AerialBooth:单幅图像文本控制的航拍视图综合中的互信息导向
通过文本描述合成单个输入图像的空中视图,借助预训练的文本到 2D 图像稳定扩散模型作为 3D 世界的先验知识,经过微调优化文本嵌入和重建输入图像及其逆透视映射的 UNet 模型,在推理中利用互信息指导将生成图像的内容指向输入图像,通过在 7
→
PDF
7 months ago
CVPR
CLIPstyler:使用单一文本条件进行图像风格转移
提出了一种全新的神经风格迁移框架,使用户能够使用文本描述而非参考图像来实现图像的风格迁移,在实验中证实了通过使用多视图扩充的补丁式文本 - 图像匹配 Loss 来实现对内容图像的样式转移,从而实现了具有语义相似性的现实纹理风格转移。
PDF
3 years ago
Prev
Next