BriefGPT.xyz
Ask
alpha
关键词
experiment planning
搜索结果 - 1
利用函数逼近进行实验规划
我们研究了上下文强化学习中的函数逼近实验规划问题,针对数据收集过程存在较大开销的情况,我们提出了两种与函数逼近相容的实验规划策略。第一种是根据奖励函数类的边界维度实现的假设者规划和采样过程,可实现最优性保证。第二种是在动作数较小的情况下,我
→
PDF
6 months ago
Prev
Next