BriefGPT.xyz
Ask
alpha
关键词
motion and appearance-based tasks
搜索结果 - 1
重新思考基于视频学习视觉表示的特征预测
该研究探讨了以特征预测作为无监督学习的独立目标,并介绍了 V-JEPA,一个仅使用特征预测目标进行训练的视觉模型集合,无需预训练图像编码器、文本、负样本、重建或其他监督方式。我们的研究结果表明,通过预测视频特征进行学习可以得到性能良好的通用
→
PDF
5 months ago
Prev
Next