BriefGPT.xyz
Ask
alpha
关键词
benchmark spec
搜索结果 - 1
综合、诊断和优化:朝着细粒度的视觉 - 语言理解方向
视觉语言模型(VLM)在各种下游任务中展现出了卓越的性能,但是对于属性和物体间关系等细粒度的视觉语言概念的理解仍然是一个重要挑战。我们提出了一种渐进式流水线来合成在特定属性上变化而在其他方面保持一致的图像,并利用这个数据引擎设计了一个用于诊
→
PDF
7 months ago
Prev
Next