BriefGPT.xyz
Ask
alpha
关键词
quadratic programs
搜索结果 - 2
基于 QP 和 MPC 的强化学习之间的桥梁
本文采用基于 QP(Quadratic Programs)的方法,取代采用 DNN 的方法来学习 RL 中的价值函数和策略,以此提高其可解释性和简化结构,并且给出了调整可解释性和简化结构的方法。
PDF
2 years ago
ICML
OptNet: 神经网络层中的可微分优化
OptNet 是一种深度神经网络体系结构,可以将优化问题作为单独的层集成到大的可端到端可训练深度网络中,并且可以使用灵敏度分析、双层优化和隐式差分等技术来确切地区分这些层,而且能够学会硬约束优化问题,比其他神经网络工具效果更好。
PDF
7 years ago
Prev
Next