BriefGPT.xyz
Ask
alpha
关键词
attribute detectors
搜索结果 - 2
Tell-and-Answer: 基于属性和字幕的可解释视觉问答
本研究提出将端到端的 VQA 分解为解释和推理两步,使用预训练的属性检测器和图像字幕模型提取图像属性和生成图像描述,然后使用推理模块将这些解释代替图像推断问题的答案。通过对热门 VQA 数据集进行实验,我们证明了该系统具备解释性和进一步提高
→
PDF
6 years ago
CVPR
学习属性等价于多源域泛化
本文探讨了如何从图像中准确地和鲁棒性地检测属性,并借鉴了多源域泛化的方法,为学习跨类别通用属性检测器提供了一种新的视角。经过对四个具有挑战性的数据集和三个不同问题的广泛实验验证了该方法的有效性。
PDF
8 years ago
Prev
Next