problem-dependent regret bounds | BriefGPT

关键词problem-dependent regret bounds

搜索结果 - 1

ICML对抗式多臂老虎机的在线元学习
研究使用元学习算法解决敌对多臂赌博机问题，在每个 episode 中利用经验分布提高算法性能，并得到了针对该问题的最小遗憾界。
PDF2 years ago