可重复的随机排列集合
本研究提出了随机置换集(RPS)的最大熵原理,并通过数值实验验证,结果表明最大熵的 RPS 与最大邓(Deng)熵和最大香农熵相容。当排列事件中元素的顺序被忽略时,RPS 的最大熵将退化为最大邓熵;当每个排列事件被限制为仅包含一个元素时,RPS 的最大熵会退化为最大香农熵。
Dec, 2021
通过在随机排列集合理论(RPST)的性质基础上构建随机行走模型,并进行蒙特卡罗模拟,我们发现通过 RPST 生成的随机行走表现出与高斯随机行走类似的特征,并可以通过特定的极限缩放过程转化为维纳过程,从而为 RPST 和随机行走理论建立了新的联系,扩展了 RPST 的适用性,并展示出结合这两种方法优势以改进问题解决能力的潜力。
Apr, 2024
提出了一种证据模式推理模型(EPRM),并引入了随机图集(RGS)和随机排列集(RPS)以建模复杂关系和表示更多事件类型,通过冲突解决决策实施的 EPRM 相对于平均速度决策优化了 18.17%的案例,有效改进了飞机速度排序。
Feb, 2024
提出了一个新的置换相关的推荐系统架构 PRF,并且通过在淘宝应用程序的实际应用中取得 11.0%的 PV 平均值和 8.7%的 IPV 平均值,性能超过当前最先进的方法。
Feb, 2021
Sign-Perturbed Sum (SPS) 是一种强大的有限样本系统辨识算法,可以为任何有限样本大小的真实数据生成系统构造具有确切覆盖概率的置信区间。本论文旨在填补这一研究空白,首次提供了关于 SPS 样本复杂度的结果,以及对于标量线性回归问题中 SPS 置信区间行为的研究,提供了基于三组不同假设条件的高概率上界,表明如果观测误差是亚高斯分布,那么 SPS 置信区间的大小将以几何速率收敛于真实参数,并且同样的界限适用于先前提出的置信区域外估计,最后,我们通过模拟实验证明了理论和经验的收敛速度。
Jan, 2024
该研究提出了一种改进的算法,MatchFAME,用于估计观察到的偏部分置换的损坏水平,并实现了不需要谱初始化的非凸加权投影功率方法,证明在对抗性损坏下,CEMP-Partial 能够精确分类损坏和清洁的部分置换。
Mar, 2022
该研究提出了 Efficient PSRO 方法来解决传统 Policy Space Response Oracle 方法中存在的计算和探索效率低的问题,通过引入 no-regret optimization 和 parallelization 等技术,有效地优化了算法,在保证 Kuhn 和 Leduc Poker 博弈中的可利用度的情况下,提高了 50x 的速度和 10 倍的数据效率。
Jan, 2022
为了解决非传递性的零和游戏问题,该研究提出了一种名为 Fusion-PSRO 的方法,通过模型融合初始化策略,以更好逼近最佳反应策略,并在非传递性矩阵游戏和复杂 Liars Dice 等实验中验证了其在提高几乎所有 PSRO 变体性能方面的有效性。
May, 2024