BriefGPT.xyz
Ask
alpha
关键词
trust region method
搜索结果 - 2
PETScML:科学机器学习中用于训练回归问题的二阶求解器
最近几年,我们见证了科学机器学习作为一种数据驱动的工具的兴起,通过深度学习技术分析计算科学和工程应用产生的数据。这些方法的核心是监督训练算法,用于学习神经网络实现,这是一个非常非凸的优化问题,通常使用随机梯度方法来解决。然而,科学机器学习训
→
PDF
4 months ago
基于高效信任区域的安全增强学习与低偏差分布演员 - 评论家
本文提出了一种基于信任区域方法的安全分布式强化学习方法,包括针对分布式评论家的估计偏差的降低,用 Q 函数表示的信任区域方法的新代理以及从不安全的初始代理找到满足所有约束的代理的梯度集成方法,实验表明,该方法表现出最小的约束违规,同时实现了
→
PDF
a year ago
Prev
Next