BriefGPT.xyz
大模型
Ask
alpha
关键词
weakly paired images
搜索结果 - 2
ICCV
共享多模态嵌入的无监督图像字幕生成
通过共享的、结构化的视觉概念潜在空间,将图像特征转化到语义向量嵌入空间中,并使用同一语言模型将其解码为场景描述,无需明确监督来了解图像;这种转化借助于暴露于图像 / 标题数据分布之外的大型文本语料库,并且具有鲁棒性。
PDF
5 years ago
利用弱配对约束调整深度视觉运动表示
提出了一种新颖的领域适应方法,将在大型易于获得的源数据集 (例如,合成图像) 上学习的视觉表示适应到目标实际世界领域,不需要昂贵的手工数据注释。作者使用弱对齐图像,结合分布对齐的方式来解决实际和模拟环境差异的问题,并在机器人操作任务上对其进
→
PDF
9 years ago
Prev
Next