BriefGPT.xyz
Ask
alpha
关键词
dynamic scenario
搜索结果 - 2
ICLR
Equal Improvability: 一个考虑长期影响的新公平性概念
提出一种新的公正性指标 EI (即平等的可改进性),并且提出了三种算法来解决 EI 规则化优化问题。实验结果表明,使用 EI 指标可以实现长期公正性。
PDF
2 years ago
多人赌博机问题:一种追踪方法
本文研究了具有许多玩家的随机多臂老虎机。结果表明我们提出的一种新的 “徒步旅行策略” 不需要估计玩家的数量,同时保证了静态情况下常数风险和动态情况下高概率的子线性风险表现。我们还证明了我们的算法的有效性。
PDF
6 years ago
Prev
Next