BriefGPT.xyz
大模型
Ask
alpha
关键词
spatiotemporal signals
搜索结果 - 1
TVTSv2:学习开箱即用的大规模时空视觉表示
本论文分析了导致视频模型性能下降的因素 —— 语言监督失真,提出了一种去除降级的预训练策略,并采用排序任务同时使用掩蔽技术进行可扩展的训练,得到了一系列新的模型。
PDF
a year ago
Prev
Next