BriefGPT.xyz
Ask
alpha
关键词
visual commonsense knowledge
搜索结果 - 2
ImageNetVC:1000 个 ImageNet 类别上的零样本视觉常识评估
本文利用人为标注的数据集 ImageNetVC,探究了先前被作为通用接口使用的 预训练语言模型(PLMs)和其带视觉增强的对应模型(VaLMs)的视觉常识知识掌握情况及其影响因素。同时,通过研究大规模模型的因素,提供了对视觉常识知识丰富的自
→
PDF
a year ago
ACL
训练模型对视觉常识知识的学习
研究利用多模态模型来学习语言的局限性,提出了两个评估任务来衡量语言模型在视觉常识知识方面的表现。结果发现,基于视觉文本数据的多模态模型和单模态模型在视觉常识知识方面表现不显著不同。
PDF
2 years ago
Prev
Next