BriefGPT.xyz
Ask
alpha
关键词
compositional understanding
搜索结果 - 5
从博弈论视角诊断视觉语言模型的组合知识
通过评估不同方面的结构性理解,例如关系和属性,系统地揭示了视觉语言模型在结构性推理方面的弱点,并提供了有用且可靠的指导,以便未来的研究。
PDF
a month ago
显式表示语法提升预测意外情境下的句子布局
通过自然语言句子中的识别视觉实体和将其按照二维空间布局排列,需要对语言和空间进行构造性理解。本研究通过对比显示,如果句子提到了在训练期间看到的类似实体关系,则可以从隐式或显式编码句子句法的语言表示中预测布局。为了测试构造性理解,我们收集了一
→
PDF
5 months ago
SugarCrepe:修复视觉语言组合基准的可黑客化问题
本文提出了一种新的视觉 - 语言组合性评估基准 SugarCrepe,采用大型语言模型和对抗性优化机制,有效地降低了现有评估基准的偏差,并重新评估了最先进的模型和近期提出的组合性诱导策略,发现它们的改进被高估了,需要在这一重要方向上进行更多
→
PDF
a year ago
VisualGPTScore:多模态生成预训练评分的视觉语言推理
使用 VisualGPTScore 作为评估模型的强基准线,因为它表现出在最近提出的基于图片和文本检索的基准测试中良好的组合理解性能,该模型将 VisualGPTScore 分解为 P(text)和 Pointwise Mutual Inf
→
PDF
a year ago
人工神经网络中的绑定问题
在本文中,我们提出了一个统一的框架来解决神经网络在实现人类水平泛化方面的困难,并认为这种组合方法对于实现人类水平泛化是至关重要的。通过从神经科学和认知心理学的丰富研究中获取灵感,并调查机器学习文献中的相关机制,我们确定了一些归纳偏见的组合,
→
PDF
4 years ago
Prev
Next