BriefGPT.xyz
Ask
alpha
关键词
partial monitoring games
搜索结果 - 2
AAAI
信息约束在线学习中的适应性
研究了如何适应信息获取成本昂贵的在线学习问题中平稳变化环境的影响;提出了一种算法用于处理标签有效预测的问题,并扩展到标签有效的赌博反馈和揭示行动部分监测游戏等领域,显著提高了现有算法的性能。
PDF
5 years ago
反馈图的在线学习:超越赌博机
研究在线学习问题中的反馈问题,证明反馈图的结构控制引起的学习难度,并给出了三个类别的反馈图的理论极限表现和影响。
PDF
9 years ago
Prev
Next