BriefGPT.xyz
Ask
alpha
关键词
action representation learning
搜索结果 - 2
基于时序和潜变量的对比损失的视觉强化学习方法:TACO
本文介绍了一种名为 TACO 的时间驱动对比学习方法,通过优化当前状态与行动序列表示和相应未来状态表示之间的相互信息,同时学习状态和行动表示,并在深度强化学习的多个方面上实现了性能提升。
PDF
a year ago
CVPR
通过序列对比学习获取长视频的逐帧动作表示
本文提出了一种新颖的对比行动表示学习(CARL)框架,用于以自我监督的方式学习帧级行动表示,特别是针对长视频。该框架包括一个简单而高效的视频编码器,以及应用于一系列时空数据增强的新颖序列对比损失(SCL)。我们通过 FineGym,Penn
→
PDF
2 years ago
Prev
Next