Jan, 2023

概率上任何时间安全的随机组合半臂匪

TL;DR提出了 probably anytime-safe stochastic combinatorial semi-bandits 问题及其改善风险的算法 PASCombUCB,可应用于推荐系统和交通运输领域等代理人在单个时间步内选择多个项目并希望在整个时间范围内控制风险的情境。