BriefGPT.xyz
Ask
alpha
关键词
algorithmic progress
搜索结果 - 2
ICLR
深度策略梯度的实现问题: PPO 和 TRPO 的案例研究
通过对两种流行算法(PPO 和 TRPO)的案例研究,我们研究了深度策略梯度算法中算法进展的根源,并调查了 “代码级优化” 的后果:这些优化仅出现在其他实现中或被描述为核心算法的辅助详细信息,它们似乎具有次要影响,但实际上极大地影响了代理行
→
PDF
4 years ago
测量神经网络算法效率
通过计算量的减少和算法效率的提高,探讨了算法进步方面的量化问题,认为硬件和算法的效率提升是倍增的,应该综合考虑这两个因素来评估人工智能的进展。
PDF
4 years ago
Prev
Next