BriefGPT.xyz
Ask
alpha
关键词
procedural videos
搜索结果 - 3
视频本地化指令生成的高效预训练
通过 Sieve 和 Swap 技术自动筛选和替换人工写入的文本指导,构建一个比当前大规模数据集小三个数量级的精选数据集,从而提高大规模模型在过程视频中的性能。同时使用 Procedure Transformer (ProcX) 进行步骤定
→
PDF
7 months ago
ICCV
GePSAn:烹饪视频中的生成式步骤预测
未来步骤预测问题的核心挑战是如何考虑自然场景中多种可能性的未来实现,该论文通过建立一个生成模型来拟合可能的下一步候选结果的分布,从而解决此问题。
PDF
9 months ago
STEPs: 从无标签过程视频中自监督提取关键步骤
通过提出的 Bootstrapped Multi-Cue Contrastive (BMC2) Loss,我们成功地建立了一个轻量级的时间模型,该模型使用现成的特征进行自我监督,并能够从多个提示信号中获取信息,最终实现从无标记程序性视频中提
→
PDF
2 years ago
Prev
Next