BriefGPT.xyz
大模型
Ask
alpha
关键词
cross-modal search
搜索结果 - 2
视觉语言预训练的精简与有效的跨模态检索
基于大规模预训练模型的学习哈希方法为跨模态检索提供了性能优化,并引入了一种名为 DCMQ 的新方法,利用 VLP 模型的语义知识改进了哈希表示学习,通过引入 PQG 量化方法和 NPC 转换进一步提高了检索性能。
PDF
a month ago
ICCV
场景设计师:从草图到场景搜索与合成的统一模型
Scene Designer 是一种利用手绘场景构图自由搜索和生成图像的新方法,其核心是一个学习跨模态搜索嵌入和布局合成物的单一统一模型,我们表明需要使用一个图网络和变压器进行对比学习以实现目标类型、外观和布局之间的相关性学习,驱动掩模生成
→
PDF
3 years ago
Prev
Next