BriefGPT.xyz
大模型
Ask
alpha
关键词
roll-drop
搜索结果 - 1
Roll-Drop:用单参数解决观测噪声的计算
本文提出一种名为 Roll-Drop 的深度强化学习(DRL)的简单策略,通过在模拟期间使用 dropout 来考虑观察噪声,而不需要为每个状态显式地建模其分布。我们演示当将高达 25%的噪声注入观测后,成功率达到 80%,其鲁棒性比基线提
→
PDF
a year ago
Prev
Next