BriefGPT.xyz
Ask
alpha
关键词
a-cap
搜索结果 - 1
CVPR
A-CAP: 带有常识知识的预测字幕生成
通过引入一种新任务,即预期字幕,来模拟人类基于时间顺序的视觉暗示进行未来思考的能力,并提出了一种名为 A-CAP 的模型,该模型将常识知识并入预训练的视觉和语言模型中,使其能够进行预期字幕,并在定制的视觉叙述数据集上进行定量和定性评估,A-
→
PDF
a year ago
Prev
Next