BriefGPT.xyz
大模型
Ask
alpha
关键词
state observations
搜索结果 - 2
识别学习运动技能的重要感觉反馈
使用深度强化学习,通过神经网络作为状态 - 动作映射,通过量化分析系统显著性分析来确定机器人学习的关键状态以实现迈步技能学习,其中包括平衡恢复,慢跑,奔跑,步态和奔跑。
PDF
a year ago
ICLR
基于学习得到的优化对手的状态观测下鲁棒强化学习
研究了强化学习在面对敌对攻击 (即使状态的扰动) 时的鲁棒性,并提出了一种基于 ATLA 框架的方法来增强 Agent 的鲁棒性,通过训练 online 的对抗学习可以达到最优敌对攻击框架与提前学习历史数据等手段,从而提高强化学习在实验中的
→
PDF
3 years ago
Prev
Next