BriefGPT.xyz
Ask
alpha
关键词
explicit object position modeling
搜索结果 - 1
EMNLP
PEVL:基于位置增强的预训练和提示微调的视觉语言模型
本研究提出了一种名为 PEVL 的显式目标位置建模方法,来提高 VLP 模型在特定视觉 - 语言任务(如指称表达理解和视觉常识推理)上的性能。该方法通过将离散化目标位置与语言内容整合到一个语言建模框架中,在预训练和提示微调阶段实现显式的视觉
→
PDF
2 years ago
Prev
Next