BriefGPT.xyz
大模型
Ask
alpha
关键词
video frame
搜索结果 - 2
孪生掩模自编码器
本文提出了基于 SiamMAE 的 Siamese Masked Autoencoders 方法,使用视频学习视觉对应关系,通过对大量补丁进行遮罩,鼓励网络集中学习运动对象和学习以对象为中心的表示。该方法可以在不依赖数据增强或用于防止表示崩
→
PDF
a year ago
在线动作检测的时序循环网络
本文提出了一种新颖的框架 Temporal Recurrent Network (TRN) 来模拟视频帧的时间上下文,在线执行行动检测并预测即将发生的行动,实现了累积历史证据和预测未来信息相结合的在线识别方式,并在 HDD、TVSeries
→
PDF
6 years ago
Prev
Next