ICLRApr, 2020

变分带宽瓶颈:信息预算上的随机评估

TL;DR该研究提出了一种变分带宽瓶颈方法,针对含有 “特权” 输入的问题设置,根据所使用的标准输入对特权输入的值进行估计,并基于此选择随机访问或不访问特权输入,以实现压缩和通用性或降低通信成本等目的,该方法在强化学习实验中得到应用。