BriefGPT.xyz
Ask
alpha
关键词
asymptotical optimality
搜索结果 - 1
具上下文的无休止多臂赌博机在需求响应决策中的应用
介绍了一种新的多臂赌博机框架 —— 上下文不安定赌博机(CRB),用于复杂的在线决策。该 CRB 框架结合了上下文赌博机和不安定赌博机的核心特征,可以模拟每个臂的内部状态转换以及外部全局环境上下文的影响。使用双重分解方法,我们开发了一个可扩
→
PDF
4 months ago
Prev
Next