Mar, 2014

信息引导采样的优化学习

TL;DR该研究提出了一种新的信息导向采样的方法,它适用于在线优化问题,通过学习部分反馈,决策者需要在探索和利用之间取得平衡。