BriefGPT.xyz
Ask
alpha
关键词
retrieval process
搜索结果 - 1
离线不平衡数据集的强化学习
通过在分布式的约束条件如 onservative Q-learning 基础上引入信息检索过程,有效地减轻了失衡数据集所带来的挑战,我们提出了一种新颖的离线强化学习方法,并在不同程度失衡的数据集上的几个任务中评估了其优劣。
PDF
a year ago
Prev
Next