BriefGPT.xyz
大模型
Ask
alpha
关键词
multi-modal celeba-hq dataset
搜索结果 - 3
TextCLIP:无对抗训练的文本指导人脸图像生成与操作
提出了 TextCLIP,这是一个统一的框架,用于无对抗训练的文本引导的图像生成和操作,通过对 Contrastive Language-Image Pre-training (CLIP) 的文本图像表示能力和 StyleGAN 的生成能力
→
PDF
9 months ago
利用多细粒度环境特征聚合提高基于标题监督的人脸识别
引入了一种基于描述指导的人脸识别(CGFR)框架来提高商品化人脸识别系统(COTS FR)性能,通过引入面部描述信息作为辅助信息来改善性能,通过使用上下文特征聚合模块(CFAM)和文本特征细化模块(TFRM)来有效地处理文本和面部特征间的异
→
PDF
a year ago
CVPR
TediGAN: 基于文本引导的多样化人脸图像生成和操作
本文提出 TediGAN 框架,用于多模态图像生成和操作。该方法包括三个组件:StyleGAN 反演模块,视觉 - 语言相似度学习和实例级优化。模型可使用多模态输入生成多样化,分辨率为 1024 的高质量图像,并提出 Multi-Modal
→
PDF
4 years ago
Prev
Next