BriefGPT.xyz
Ask
alpha
关键词
visual-language alignment
搜索结果 - 1
AAAI
视觉问答中的物体属性重要性
提出了一种基于物体属性利用的视觉问答方法,旨在实现更好的物体级视觉 - 语言对齐和多模态场景理解。通过属性融合模块和对比知识蒸馏模块,构建多模态图神经网络,融合属性和视觉特征,改善细粒度问题的解决和多模态场景的理解,从而提高模型的鲁棒性。通
→
PDF
7 months ago
Prev
Next