BriefGPT.xyz
Ask
alpha
关键词
grid-based navigation
搜索结果 - 1
多任务强化学习中的知识精炼优化传递
通过使用 Sinkhorn 映射来替换 Kullback-Leibler 散度,进一步提高多任务强化学习的数据效率,并通过实验证明新增的基于最优传输的奖励可以加速智能体的学习过程,优于多任务学习中的几个基准模型。
PDF
9 months ago
Prev
Next