关键词quadratic approximation
搜索结果 - 3
- 对抗鲁棒性和可解释性的二阶优化
提出了一种使用二次近似的拟合函数的新型规则化器,并通过迭代计算逼近最坏情况二次损失,从而在具有良好的鲁棒性的同时避免了梯度混淆和降低了训练时间。实验证明,该模型产生的人类可解释性特征优于其他几何正则化技术,并且这些鲁棒特征可用于提供人性化的 - IJCAI回顾性信任区域策略优化
我们提出了一种新的强化学习算法:Hindsight Trust Region Policy Optimization,它通过利用 hindsight 来提高稀疏抽奖的表现,并引入了 QKL 和 HGF 两种方法来提高学习稳定性和表现。我们在 - DQM: 分散的二次近似交替方向乘子方法
本文提出了一种分散式的求解全局目标函数最小化问题的算法 —— 分散式二次逼近交替方向乘子法(DQM),通过在每次迭代中最小化 DADMM 最小化目标函数的二次逼近,可以减少计算成本并仍然保持收敛速度达到 DADMM 的线性收敛率常数,并在逻