BriefGPT.xyz
Ask
alpha
关键词
multimodal image analysis
搜索结果 - 1
ICCV
SelfGraphVQA:基于自监督图神经网络的基于场景的问题回答
通过使用预训练场景图生成器从图像中提取场景图,并应用语义保持增强和自监督技术,我们引入了 SelfGraphVQA 框架,改进了图表示在视觉问答任务中的利用,从而避免昂贵和潜在有偏的注释数据,并通过图像增强创建提取图的多个视图,通过优化它们
→
PDF
9 months ago
Prev
Next