BriefGPT.xyz
Ask
alpha
关键词
performance instability
搜索结果 - 2
ICLR
DARTS-: 无需指标强化的稳定性能提升
本文针对不同 iable architecture search(DARTS)的长期性能不稳定问题,提出一种名为 DARTS - 的辅助 skip connection 的方法来解决它,从而提高其鲁棒性。
PDF
4 years ago
真正靠近策略优化
本文介绍了一种名为 Truly PPO 的增强 PPO 方法,针对 PPO 在优化行为方面存在的问题进行了改进,通过使用新的剪辑函数来支持回滚行为,使用基于可信区域的触发条件替换剪辑的触发条件,从而提供了保证的拟态策略性能单调改进,从而改善
→
PDF
5 years ago
Prev
Next