BriefGPT.xyz
Ask
alpha
关键词
victor
搜索结果 - 1
对比多模态预训练理解中文视频和语言
本文提出了一种新型的视频 - 语言理解框架 VICTOR,通过对比学习范式构建了几个新型代理任务,使模型在不同角度能够更稳健并能够捕捉更多复杂的多模态语义和结构关系。通过在一个包括 10,000,000 个视频及其相应高质量文本描述的大规模
→
PDF
3 years ago
Prev
Next