BriefGPT.xyz
Ask
alpha
关键词
compounding error
搜索结果 - 2
SAFE-GIL:安全引导的模仿学习
SAFE-GIL 通过对专家进行对抗性干扰来引导数据采集,从而解决行为克隆方法的 “错误混合问题”,在安全关键状态下更接近专家行为,并在低数据情况下提高任务成功率和安全性。
PDF
3 months ago
改进的基于长短期记忆模型的深度强化学习废水处理模拟器
在废水处理中,尽管深度强化学习在机器人技术和游戏领域取得了杰出的成果,但在工业流程优化方面仍面临挑战。本研究通过使用模型的预测数据作为输入以进行校正,并改变损失函数以考虑长期预测形态(动态),提供了改进废水处理数据训练模型的两种方法,提高了
→
PDF
3 months ago
Prev
Next