- ICLR面向人群大小的平均场博弈策略优化
本文提出了一种名为 PAPO 的方法,通过结合增强和超网络的方式,在同时考虑人口数量和生成策略的前提下,进行不同人口数量游戏的策略优化,并在多个环境中进行了实验和分析,验证了该方法在群体博弈中取得了非常显著的优越性。
- MM基于容忍原则推导语言的动力学系统
该研究在以获得驱动框架中推导出语言的显式动力系统,假设儿童 / 学习者在语言习得过程中遵循容差原则,考虑了不同的理论参数,如种群大小,以及为学习者提供数据的以前几代的数量。
- 从遗传漂变理解到用于分布估计算法的智能重启机制
通过量化分析和实验验证,我们设计了一种基于 “智能重启机制” 的 EDAs 算法,可以自动识别较好的参数,并且在许多情况下充分展示了其优异的性能表现。
- 真实世界的游戏看起来像陀螺
本文研究现实世界游戏(如井字棋,围棋,星际争霸 II)的几何特性并证明它们与竞技场上的旋转体结构相似。此结构形成的不对称性带来了关于学习与策略的问题,我们用 9 个现实世界两人零和对称游戏进行了实证。
- cGA 在跳跃函数上的严格运行时分析 —— 无额外成本的 EDA 也能跨越适应度山谷
该研究针对超过一定规模的高维跳跃函数,证明了一种新型的基于紧凑遗传算法(compact genetic algorithm,cGA)的最优解搜索算法具有较快的运行速度,且此算法可在无额外耗费的情况下穿越低适应度的中等大小的山谷。同时提供了平 - 神经 MMO:用于智能体训练和评估的大规模多智能体游戏环境
通过模拟 MMORPG 游戏和真实世界中的有限资源竞争环境,研究了大规模多智能体交互的学习和发展,实验表明,种群规模可以放大并刺激技能行为发展,产生优于小规模训练的代理人。
- 学习参数人口的最大似然估计
研究了在观测了 Bernoulli 试验结果的基础上,针对具有未知分布的参数,利用最大似然估计方法准确地估计总体分布,提出了一种在样本容量不大于总体个体个数的情况下,MLE 能达到统计最优和高效计算的方法。
- 随机可满足 3-CNF 公式上 $(1+(λ,λ))$ 遗传算法的运行时分析
本研究对于遗传算法在随机 3-SAT 问题上的运行时间进行了严格的分析,并针对较弱的适应性 - 距离相似性提出了解决方案。研究结果表明,引入一个上限可以避免种群大小过大而导致的问题,并证明了该算法可以有效地解决组合搜索和优化问题。
- 进化算法中,大的种群规模可能并不有益
本文分析种群在进化算法中的作用和影响,证明了大规模种群不总是有益的,讨论了其影响机制和节约计算时间的方法。
- 朝着完全抬升的基于搜索的概率推理
本文研究了提升概率推断在关系概率模型中的应用,以及在没有对未明确提及的个体进行单独推理的情况下,如何避免共性推理的现象,同时给出了两个主要结果:一般情况下,需要对个体进行单独推理,而当使用基于无限制参数随机变量的方法进行推理时,这个情况也可