BriefGPT.xyz
Ask
alpha
关键词
shared confidence bounds
搜索结果 - 1
机器与人类交替学习
本文提出一种具有自适应性的算法,使得现有的强化学习代理可以在机器和人类代理之间进行控制转换,在类似环境中可以找到多个转换策略序列,并演示了该算法在半自动驾驶场景中具有优越性。
PDF
4 years ago
Prev
Next