BriefGPT.xyz
Ask
alpha
关键词
static lipschitz risk measures
搜索结果 - 1
可证明的风险敏感分布式强化学习与通用函数逼近
该研究介绍了一种风险敏感的分布式强化学习 (RS-DisRL) 框架,包括静态 Lipschitz 风险度量、泛函逼近等,用于分析评估 RSRL 策略的估计函数对其有效性和样本复杂度的影响,并设计了两种创新的元算法:面向基于模型的函数逼近的
→
PDF
5 months ago
Prev
Next