BriefGPT.xyz
Ask
alpha
关键词
risk averse decision making
搜索结果 - 1
风险厌恶 POMDP 的简化与绩效保证
在部分可观察域中,面临不确定性的风险规避决策是人工智能领域的一个基本问题,对于可靠的自主代理至关重要。本研究使用部分可观察的马尔可夫决策过程(POMDPs)建模并采用回报的条件风险价值(CVaR)作为值函数。这项工作开发了一个简化框架,以加
→
PDF
a month ago
Prev
Next