BriefGPT.xyz
Ask
alpha
关键词
hyperbolic vision-language learning
搜索结果 - 1
CVPR
使用合成标题进行超球学习的开放世界检测
通过将视觉语言模型 (VLMs) 的知识传递进行启发式操作,从而丰富开放词汇的图像描述。同时,采用新的超几何视觉语言学习方法对合成字幕产生的噪音进行缓解,实现了视觉与字幕嵌入之间的层次关系。在各种开放世界检测基准测试 (COCO、LVIS、
→
PDF
3 months ago
Prev
Next