BriefGPT.xyz
Ask
alpha
关键词
hetpevi algorithm
搜索结果 - 1
ICML
基于扰动数据源的可证明高效离线强化学习
本文研究了使用多个数据集进行离线强化学习的问题,提出了一种考虑样本和数据源不确定性的算法,并在离线马尔科夫博弈和离线鲁棒强化学习方面进行了推广。
PDF
a year ago
Prev
Next