关键词temporal contrastive learning
搜索结果 - 5
- 多智能体基于时间对比学习的迁移学习
该研究介绍了一个用于深度多智能体强化学习的新型迁移学习框架。该方法通过自动组合目标条件策略和时间对比学习,发现有意义的子目标。实验证明,该方法在多智能体协调任务 Overcooked 上能够提高样本效率,解决稀疏奖励和长期规划问题,并且相比 - ICLR从视频中实现强化学习的原则性表示学习
研究使用视频数据进行决策预训练表示学习,讨论两种情景:观察中的独立同分布噪声和存在外部噪声的困难情景,验证了在不同情境中学习表征方法的样本复杂度和性能表现。
- 谱时对比学习
无监督学习与对比学习相结合的时间对比学习方法(STCL)基于谱分析来构建损失函数,利用示例数据的线性探测表现来评估图的谱特性。
- CVPR对比条件神经过程
本研究针对 Stochastic Processes 中函数的近似,提出了一种基于 Conditional Neural Processes 的方法并引入噪声对抗学习来改善生成模型的一些固有限制。具体而言,本方法包含两个辅助的对比分支(TC - 深度强化学习的马尔可夫状态抽象学习
该研究提出了一种学习马尔科夫状态抽象表示的新方法,结合逆向模型估计和时态对比学习,可以提高强化学习中的样本效率。