BriefGPT.xyz
Ask
alpha
关键词
self-supervised reinforcement learning
搜索结果 - 3
基于自监督强化学习的图像去雨
本研究使用自我监督强化学习(RL)方法进行图像去雨,利用字典学习定位雨线像素并使用像素级 RL 代理逐步去除雨水。实验结果表明,该方法在几个基准图像去雨数据集上表现优于最先进的少样本学习和自我监督去雨和去噪方法。
PDF
3 months ago
自监督简化深度强化学习
通过自监督回归学习策略网络,提出了一种基于监督损失函数训练深度强化学习智能体的算法 (SSRL),该算法无需策略梯度或价值估计,能够通过监督回归数据来稳定提高策略表现并在效率和性能方面与现有算法相媲美,展示了利用监督学习技术解决强化学习问题
→
PDF
3 years ago
ICML
以变分授权为代表学习目标导向的强化学习
通过代表愿景达成的功能感知状态表示进行的变分互信息最大化,能够为达到愿景状态的广泛应用的多任务策略的自监督强化学习提供框架和方法,同时还提出了广义 GCRL 和 MI-Based RL 的统一方法,即 VGCRL,并结合方法的容量和光滑性分
→
PDF
3 years ago
Prev
Next