BriefGPT.xyz
Ask
alpha
关键词
problem-dependent regret bounds
搜索结果 - 1
ICML
对抗式多臂老虎机的在线元学习
研究使用元学习算法解决敌对多臂赌博机问题,在每个 episode 中利用经验分布提高算法性能,并得到了针对该问题的最小遗憾界。
PDF
2 years ago
Prev
Next