fair contextual bandits | BriefGPT

关键词fair contextual bandits

搜索结果 - 1

$α$- 公平上下文强化学习
设计了一种高效算法，确保在全信息和强盗反馈设置中几乎达到次线性的遗憾，以解决 alpha-fair contextual bandits 问题。
PDF8 months ago