BriefGPT.xyz
Ask
alpha
关键词
feasible sets
搜索结果 - 2
利用可行集的曲率在在线凸优化中获得快速速率
基于在线凸优化和曲率的可行集合的分析,本文提出了一种新的方法通过利用可行集合的曲率来实现快速收敛,不仅可以适用于凸损失函数,同时还能在随机、对抗性和受干扰的环境下获得良好的性能。
PDF
5 months ago
ICML
可达性约束强化学习
本文提出了基于可达性分析的 RCRL 方法来解决 CRL 中的安全约束问题,并利用可达性分析来建立新的自洽性条件以及特征化可行集。在多个基准测试中,RCRL 方法展现了优于 CRL 和安全控制基准的可行集、策略绩效和约束满足性。
PDF
2 years ago
Prev
Next