BriefGPT.xyz
Ask
alpha
关键词
conjugate gradient descent
搜索结果 - 2
AAAI
基于共轭策略的策略梯度方法的多样化探索
本文提出通过共轭策略的多样化探索(DE),以解决在政策梯度方法中保持良好性能的有效探索的问题,DE 学习和应用一组共轭策略,并提供了理论和实证结果,证明 DE 实现了探索,提高了策略性能,并优于探索随机策略扰动。
PDF
5 years ago
Riemannian 优化在低秩矩阵补全中的保证
研究嵌入低秩矩阵流形的黎曼优化方法在矩阵补全问题上的应用和收敛性,其中采样复杂度能进一步通过重新采样的黎曼梯度下降初始化方法减小,这取决于采样算子的像的非对称限制性同构性质和低秩矩阵流形的曲率。
PDF
8 years ago
Prev
Next