internal model | BriefGPT - AI 论文速递

关键词internal model

搜索结果 - 4

ICML图神经网络诱导价值迭代
通过引入图神经网络，该论文提出的价值迭代算法执行图神经网络，跨越任意环境模型，并在 VI 的中间步骤上受到直接监督，证明了具有强监督的 GNN 执行者是深度强化学习系统中可行的组成部分。
PDF4 years ago
ICML基于观测的内部模型用于奖励塑造
本研究提出一种新的强化学习方法，即基于内部模型的奖励估计方法，通过预测给定专家状态分布的预测模型来估计奖励，进而直接从专家操作的视频中成功训练出良好的策略。
PDF6 years ago
学习自然物理的经验式学习：通过戳来学习戳
研究了一种通过经验学习范例以获取内在的直觉物理模型的方法，并使用基于深度神经网络的新方法进行模型评估，提出了一个将机器人与图像相结合的模型学习动态模型的方法，在估计正向和反向模型的时候，反向模型的目标提供了构建有信息量的视觉特征的监督，这种
PDF8 years ago
学习视觉预测物理模型以打台球
本文中，我们探讨了一种方法，能够让智能体装备内部的世界动态模型，并通过运行多个内部仿真（“视觉想象”）来规划新型动作。我们的模型直接处理原始视觉输入，并使用基于目标中心的视觉快照（聚焦）的新颖物体中心预测公式来强制学习物理定律的平移不变性。
PDF9 years ago