BriefGPT.xyz
Ask
alpha
关键词
environment interaction
搜索结果 - 3
QuestEnvSim:基于环境感知的稀疏传感器模拟运动跟踪
使用强化学习相结合的物理模拟和环境观察,可以在高度约束的环境中生成逼真的全身姿势,从而避免接触的干扰。
PDF
a year ago
利用上下文结构生成有用的辅助任务
通过生成和学习有用的辅助任务,最大化经验重用,从而学习解决给定任务的方法,通过计数推理和离线策略方法同时学习这些辅助任务,从而实现多任务强化学习的新框架。
PDF
a year ago
马尔可夫决策过程中因果信息和价值的统一贝尔曼方程
研究人工智能代理和其环境的交互,探讨了在信息理论限制下如何通过强化学习算法使代理能够在无限时间范围内获得最大化的预期回报。首次提出了环境和代理之间因果信息的贝尔曼递归方程,与值函数的贝尔曼递归方程结合使用。
PDF
7 years ago
Prev
Next