BriefGPT.xyz
Ask
alpha
关键词
observation processing
搜索结果 - 1
IJCAI
CROP: 基于紧凑重塑观察处理的分布偏移鲁棒性强化学习
本文提出 Compact Reshaped Observation Processing (CROP) 方法,通过减少用于策略优化的状态信息来提高数据效率和泛化能力,为完全可观测的观察和行动空间制定了三个 CROP,并在分布式安全格网世界中
→
PDF
a year ago
Prev
Next