BriefGPT.xyz
Ask
alpha
关键词
spectral risk measure
搜索结果 - 2
具收敛保证的谱风险安全强化学习
我们提出了一种基于谱风险度量约束的增强学习算法,该算法利用了谱风险度量的对偶性,通过双层优化结构来实现收敛性和最优性,从而在表格设置中保证了最佳性能,并在连续控制任务中展现出了最好的性能。
PDF
a month ago
频谱风险度量估计
提出一种基于数值积分的估算谱风险度量值的新方法,通过限定支撑集,实现估算浓度的指数级集中,并在合成和交通路由应用中验证理论发现。
PDF
5 years ago
Prev
Next