BriefGPT.xyz
Ask
alpha
关键词
visual entailment
搜索结果 - 5
VEglue: 通过对象对齐的联合消除测试视觉蕴涵系统
VEglue 是一种用于 VE 系统测试的基于对象对齐的联合擦除方法,它能检测出平均 11609 个问题,比基线方法高出 194%-2846%,并在平均下降 17.1%-38.2% 的情况下,显著提高模型性能(准确率增加了 50.8%)。
PDF
4 months ago
MM
基于分块对齐和词汇限制的自然语言解释视觉蕴涵
本文提出了一种名为 CALeC 的方法,旨在解决语言和图像理解中,以前的方法在语义和各种特征之间的对齐上存在问题,其包括一个基于块意识和词汇约束的生成器和一个基于关系的推理网络,用于提高视觉语言理解的精确度和生成的解释的质量。在三个数据集的
→
PDF
2 years ago
ACL
再次检查:通过视觉蕴涵进行逐步视觉问答
本文提出了一种基于视觉蕴含的选择性 - 重新排名(SAR)渐进式框架解决 VQA 模型的表面相关性问题,通过选取与图像或问题相关的候选答案,并使用视觉蕴含验证每个答案是否可信,实现了对候选答案的有效排序,从而在 VQA-CP v2 数据集上
→
PDF
3 years ago
视觉蕴涵:一种精细图像理解的新任务
本文介绍了一个新的推理任务 Visual Entailment(VE),并构建了一个数据集 SNLI-VE,用于评估已有的 VQA 基线和构建了一个名为 EVE 的模型来解决 VE 任务,这个模型达到了 71% 的准确率并展示了 EVE 通
→
PDF
5 years ago
基于视觉支持的语言学习的视觉蕴涵任务
本文介绍了一项新的推理任务 - 视觉蕴含(Visual Entailment,VE),VE 与传统的文本蕴含(Textual Entailment,TE)任务不同,它的前提是由图像定义的,而不是像 TE 任务中那样由自然语言句子定义的。在
→
PDF
6 years ago
Prev
Next