BriefGPT.xyz
Ask
alpha
关键词
algorithmic characteristics
搜索结果 - 1
离线强化学习中创建信任区域的扩散策略
离线强化学习中的扩散信任 Q 学习方法(DTQL)通过引入扩散模型作为一个强大和有表达力的策略类,消除了训练和推理过程中迭代去噪采样的需要,大大提高了计算效率,并在多个基准任务中展现了优越的性能和算法特性。
PDF
a month ago
Prev
Next