BriefGPT.xyz
大模型
Ask
alpha
关键词
visual performance
搜索结果 - 3
Dream-in-Style: 使用风格化得分蒸馏的文本到 3D 生成
通过输入文本和风格参考图像,我们提出了一种生成风格化的三维对象的方法,利用神经辐射场重建来合成与文本提示一致内容和风格参考图像的三维模型,并通过样式化评分蒸馏损失来指导文本到三维的优化过程,输出视觉合理的几何和外观。经与现有方法的比较表明我
→
PDF
a month ago
ProGEO:通过图像 - 文本对比学习生成提示,用于视觉地理定位
使用 CLIP 和对比学习方法提高视觉地理定位中的视觉性能,并解决使用多模态模型处理地理图像时所面临的挑战。
PDF
a month ago
VFHQ: 一个高质量的视频人脸超分辨率数据集和基准
本论文开发了一个自动和可扩展的管道来收集高质量的视频脸部数据集(VFHQ),并证明基于 VFHQ 训练的视频面部超分辨率(VFSR)模型可以产生比基于 VoxCeleb1 训练的模型更锐利的边缘和更细的纹理,同时时序信息在消除视频一致性问题
→
PDF
2 years ago
Prev
Next