EOMM: 一种优化用户体验的匹配框架
通过使用不同的技能预测模型,该研究分解了 MOBA 游戏玩家技能并将其影响以统计术语评估,发现在 LOL 中,游戏人物的基本技能、玩家的基本技能和玩家特定的技能是影响赛果的三个主要技能组成部分,而 DOTA2 的赛果主要受游戏角色的基本技能影响,而不会很受其他两种技能影响。
Feb, 2017
在双边撮合市场中,我们研究了竞争环境下在线学习的问题,如一方的代理人必须通过重复互动了解对另一方的企业的偏好,并与其他代理人竞争成功匹配。我们提出了一类分散、不需要协调的算法,代理人可以使用该算法在结构化匹配市场中达到稳定匹配,其决策仅基于代理人自己的游戏历史,不需要预先了解企业的偏好。研究表明,在代理人和企业的底层偏好具有现实结构假设的情况下,所提出的算法在时间范围内具有最多对数增加的后悔成本。在匹配市场的情况下,我们的结果表明,竞争不会极大地影响分散、不需要通信和协调的在线学习算法的性能。
Jun, 2022
本文研究在AI集成于社会应用的情况下,多臂赌博算法在资源分配中如何更公平地服务于用户,提出基于Shapley值的公平感知多臂赌博算法来解决问题,并通过用户研究表明该算法能够有效地帮助提高用户参与度和活跃性。
Feb, 2023
通过对对手知识的利用,我们提出了一种博弈论方法,即Minimax Exploiter,在竞争性自博弈的多智能体强化学习中显著提高了数据效率,并在不同环境下验证了其超越强基线的性能。
Nov, 2023
在这篇论文中,我们介绍了适应性的探索-延迟接受算法(AETDA)用于回应性设置,并得到了一个玩家最优稳定遗憾的 O(Nmin{N,K}ClogT/Δ²)上界,同时证明了它的激励兼容性保证。我们还考虑了更广泛的可替代偏好,在此设置中设计了一种在线DA(ODA)算法,并为其建立了一个 O(NKlogT/Δ²)的玩家最差稳定遗憾界限。
Jan, 2024
基于Proportional Payoff Allocation Game模型,分析代理者(类似于YouTube和TikTok上的内容创作者)为有限资源和用户关注度而竞争的情景,探讨纯纳什平衡是否存在,并采用多人多臂赌博机框架的在线学习算法来最大化每个代理者在一定轮次内的累积收益。
Mar, 2024
提供了一个名为CUPID的新框架,利用重新匹配实现了职位和队伍的优化分配,从而提高公平性和玩家满意度。在真实MOBA数据集的实验中,CUPID的效果超越所有基准模型,以平均相对改进7.18%的胜率预测准确性。此外,CUPID已经成功应用于一款受欢迎的在线移动MOBA游戏,显著改善了比赛的公平性和玩家满意度。
Jun, 2024
本研究解决了异质团队零和游戏中的事前均衡问题,现有的Team PSRO方法在角色不同的团队中无法覆盖所有策略空间,导致次优结果。提出了异质PSRO(H-PSRO)框架,通过优化异质团队成员的策略实现收益的单调提升,证明了其在异质团队游戏中的较低可利用性,相较于非异质基准表现更优。
Oct, 2024