BriefGPT.xyz
Ask
alpha
关键词
information-theoretic mechanism
搜索结果 - 1
信息受限基元的竞争性集成强化学习
通过信息理论机制,提出了一种基于分解原语的策略输入的设计方法,这种方法比扁平和分层策略的泛化性都更好。
PDF
5 years ago
Prev
Next