BriefGPT.xyz
Ask
alpha
关键词
task labels
搜索结果 - 1
深度终身强化学习的统计上下文检测
在线的深度强化学习环境中,使用最优输运方法中的距离度量来测量过去和当前数据流中数据点组合之间的距离,并使用经过适应的 Kolmogorov-Smirnov 计算进行统计测试,以为经验序列分配标签。任务检测和策略部署的结合允许优化终身强化学习
→
PDF
a month ago
Prev
Next