BriefGPT.xyz
Ask
alpha
关键词
no-regret learning algorithms
搜索结果 - 2
契约强化学习:用无形之手牵引力量
通过合同设计解决在线学习问题中不同利益相关方的经济利益一致性,提出一种理论框架来解决机器学习中的代理问题,并设计了有效的动态规划算法和无悔学习算法以实现最优合同和平衡探索与开发的挑战。
PDF
9 days ago
对首价拍卖中的无懊悔学习者进行策略规划
我们研究了重复的一阶售价拍卖和一般重复贝叶斯博弈的情况,在这种情况下,一个参与者(学习者)采用了一个无悔学习算法,而另一个参与者(优化者)在了解学习者的算法的情况下,策略化地追求自己的效用最大化。 对于一类被称为基于均值的无悔学习算法,我们
→
PDF
5 months ago
Prev
Next