BriefGPT.xyz
Ask
alpha
关键词
user preference compliance
搜索结果 - 1
基于部分可观测性的偏好规划的信念状态查询策略
利用参数化信念查询(BSQ)偏好在部分可观测环境中表达用户对代理行为的偏好的新框架,在目标导向的部分可观测马尔可夫决策过程(gPOMDPs)的设定中进行介绍。我们首次对这种偏好进行了形式化分析,并证明 BSQ 偏好的期望值虽然不是关于其参数
→
PDF
a month ago
Prev
Next