ICMLMay, 2022

上下文信息导向采样

TL;DR探讨了在具有上下文信息的情况下,信息导向采样 (IDS) 设计的优化方式,并通过上下文赌博问题的两个案例证明了上下文 IDS 的优势,特别强调了考虑上下文分布的重要性。进一步提出了基于演员 - 评论家算法的计算有效版本的上下文 IDS,并在神经网络上下文赌博中进行了实证评估。