restricted feedback model | BriefGPT

关键词restricted feedback model

搜索结果 - 1

带专家建议的强盗问题的改进遗憾界限
通过受限反馈模型，本研究提供了关于 “专家建议问题” 的最坏情况后悔度的新的下界和上界，其中下界为 O (sqrt (KT ln (N/K)))，上界与之相匹配，并改进了现有最佳下界 sqrt (KT (ln N) / (ln K))。同时
PDF16 days ago