关键词gradient variance
搜索结果 - 10
- 基于模型重参数化的策略梯度方法:理论与实用算法PDF8 months ago
- 用网络控制变量驯服联邦学习中的梯度方差PDF8 months ago
- 通过预训练稳定 RNN 梯度PDF10 months ago
- 黑盒变分推断的线性收敛性:我们应该坚持完成吗?PDFa year ago
- CVPRPA&DA: 为一致的 NAS 联合采样路径和数据PDFa year ago
- SoftTreeMax: 通过树搜索实现策略梯度的指数级方差减少PDFa year ago
- EMNLPPassage-Mask: 检索 - 阅读模型的可学习正则化策略PDF2 years ago
- NIPS使用大量控制变量的集成进行变分推断PDF6 years ago
- Kalman 梯度下降:随机优化中自适应方差减小PDF6 years ago
- 分布式重要性采样在 SGD 中的方差减少PDF9 years ago
Prev
Next