BriefGPT.xyz
Ask
alpha
关键词
pirl
搜索结果 - 2
使用演员 - 评论算法和 ReLU 网络合成程序策略
在这篇论文中,我们展示了使用 actor-critic 算法将从 actor-critic 算法学习到的策略转化为以程序形式编码的策略的连接,以此避免了需要使用特定于 PIRL 的算法的问题。实证结果表明,这种转化方法能够学习出简短而有效的
→
PDF
a year ago
自监督学习预设不变表示
本研究证明了在无监督环境下,通过使用基于 PIRL 的预处理任务可以显著改善图像语义维度的质量,且该方法可以用于提取具有良好不变性质的图像信息(如对象检测)中。
PDF
5 years ago
Prev
Next