Jun, 2019

信息受限基元的竞争性集成强化学习

TL;DR通过信息理论机制,提出了一种基于分解原语的策略输入的设计方法,这种方法比扁平和分层策略的泛化性都更好。