BriefGPT.xyz
Ask
alpha
关键词
dynamic population
搜索结果 - 3
使用自然语言的动态基于人群的元学习,用于多智能体通信
使用动态人口元学习方法来训练代理人在涉及自然语言的多智能体通信环境中与已知、未知和人类伙伴协调。在两个不同的基准博弈中进行了全面评估,并显示出我们的方法在与人类合作时优于所有先前的工作。
PDF
3 years ago
可索引和不可索引的不安定赌博机的渐进最优优先策略
本文研究了多类不定期赌徒的渐近最优控制问题,并提出了一类优先级策略,证明了在全局吸引子属性和技术条件下其是渐近最优的。我们将流体缩放技术与线性规划结果相结合,证明了当赌徒可索引时,Whittle 的索引策略包含在我们的一类优先级策略中。我们
→
PDF
8 years ago
动态人口博弈中的学习与效率
研究动态变化的人群中使用学习算法适应变化环境的重复博弈的质量,证明了如果玩家以一种保证低自适应遗憾的方式选择策略,则在许多种类的游戏中,即使变化非常频繁,也可以确保高社会福利,这一点比以前的工作更具现实意义。
PDF
9 years ago
Prev
Next