BriefGPT.xyz
Ask
alpha
关键词
object bias
搜索结果 - 2
两种效应,一个触发器:关于对比式视觉语言表示学习中的模态差异、物体偏见和信息不平衡
鉴于多模态差异,对象偏差及信息不平衡等因素,本研究通过对比视觉语言模型进行深入调查并提出了量化对象偏差的方法,揭示了信息不平衡是产生多模态差异和对象偏差的驱动因素。
PDF
3 months ago
密集对齐字幕(DAC)促进视觉语言模型中的组合推理
本文探索了影响视觉语言模型组合推理性能的两个因素:对齐图像 - 文本数据集的质量和文本的密度。通过在 CC3M 数据集上 fine-tuning CLIP 模型,我们证明了自动处理这些影响因素的方法可以使模型的组合推理性能显著提高,基于基线
→
PDF
a year ago
Prev
Next