BriefGPT.xyz
大模型
Ask
alpha
关键词
visual-language pretrained models
搜索结果 - 2
以物体为中心的视频表示对长期行动预测
本文旨在建立面向视频中长期动作预测的物体中心表示。我们提出利用视觉 - 语言预训练模型构建物体中心视频表示,通过 “物体提示” 从通用预训练模型中提取任务特定的物体中心表示。我们使用基于 Transformer 的神经架构来识别和预测人 -
→
PDF
8 months ago
IJCAI
视觉语言预训练模型:一项调查
本文主要介绍了预训练模型在计算机视觉和自然语言处理中所取得的巨大成功,着重介绍了视觉语言预训练模型 (VLPM) 的重要进展及其结构、预训练和微调策略,并提出了未来三个方向的研究建议。
PDF
2 years ago
Prev
Next