BriefGPT.xyz
Ask
alpha
关键词
internal model
搜索结果 - 4
ICML
图神经网络诱导价值迭代
通过引入图神经网络,该论文提出的价值迭代算法执行图神经网络,跨越任意环境模型,并在 VI 的中间步骤上受到直接监督,证明了具有强监督的 GNN 执行者是深度强化学习系统中可行的组成部分。
PDF
4 years ago
ICML
基于观测的内部模型用于奖励塑造
本研究提出一种新的强化学习方法,即基于内部模型的奖励估计方法,通过预测给定专家状态分布的预测模型来估计奖励,进而直接从专家操作的视频中成功训练出良好的策略。
PDF
6 years ago
学习自然物理的经验式学习:通过戳来学习戳
研究了一种通过经验学习范例以获取内在的直觉物理模型的方法,并使用基于深度神经网络的新方法进行模型评估,提出了一个将机器人与图像相结合的模型学习动态模型的方法,在估计正向和反向模型的时候,反向模型的目标提供了构建有信息量的视觉特征的监督,这种
→
PDF
8 years ago
学习视觉预测物理模型以打台球
本文中,我们探讨了一种方法,能够让智能体装备内部的世界动态模型,并通过运行多个内部仿真(“视觉想象”)来规划新型动作。我们的模型直接处理原始视觉输入,并使用基于目标中心的视觉快照(聚焦)的新颖物体中心预测公式来强制学习物理定律的平移不变性。
→
PDF
9 years ago
Prev
Next