- 现代数学中有关真实价格的论文:AI 或非 AI,本地购或非本地购
本文通过建立一个包含多个生产者、消费者的网络联系和与之关联的一个马尔科夫链模型分析了价格本质,从而研究全球性和本地性的消费对于消费者的影响,并提出了与人们直觉不同的购买建议。同时,该研究还可以被用于对人工智能技术在经济层面上的采纳进行评估。
- 用于马尔可夫数据的流式主成分分析
研究了数据点从无法分解的 Markov 链中采样的流式主成分分析(PCA)问题,提出了一个新的算法并证明了其收敛速率,解决了使用 MCMC 算法从链的稳态分布中采样的问题。
- ICLR可微分顺序蒙特卡罗采样器中的重采样梯度消失
本研究探讨了一种名为 Differentiable AIS 的抽样方法,尝试通过添加重采样步骤来提高样本有效性,并在实证和理论上验证了该方法的可行性。
- AAAI使用 MCMC 采样最大流量进行城市规模的污染感知交通路由
该研究使用基于采样的方法,通过设计污染感知的流量调度策略,实现在保证短的通行时间和充分利用道路容量的同时,避免区域污染,有效减少城市空气污染的问题。使用 SUMO 交通模拟器在世界各大城市大幅度减少了污染区域,证明了该方法的可行性。
- 一种跟踪多知识概念掌握概率的概率生成模型
我们提出了一种名为 TRACED 的模型,借助基于 markov chain 的 knowledge tracing 来跟踪学生各项知识点的理解概率,通过 LSTM 解决了 explanatory away 问题,同时采用了一个新的三元交互 - 马尔可夫链浓度不等式及其在强化学习中的应用
利用相关的数学工具证明在特定条件下,基于 Martingale Method 的 Lipschitz Function 对于给定的随机变量集合是 subgaussian,同时探讨其在强化学习中的应用。
- 串联马尔可夫链推理的策略梯度
该论文提出了一种新的强化学习决策框架,将智能体的行为建模为参数化推理马尔科夫链,利用可行的策略梯度估计进行优化,通过模拟推理马尔科夫链以接近其稳态分布来完成动作选择,并且可以通过适应性地缩短决策困难度来加速推理,该算法在诸如 Mujoco - ICLR对比学习可寻找大致视角不变函数的最优基础
本文阐述了对比学习的核函数学习方法,将其应用于 PCA 表征中,证明其具有良好的泛化性能。研究基于正对偶马尔科夫链的特征值分解方法,经实验证明表征的准确性取决于核函数参数和增强强度。
- 将跳过连接模型重新构思为可学习的马尔可夫链
本文提出了可学习的马尔科夫链理论来解释残差神经网络中跳跃连接的行为,并通过引入罚式连接来使模型更加高效。实验结果表明,该方法在多模式翻译和图像识别任务中有着优异的表现。
- 无监督声学单元发现的潜在狄利克雷分配的时间扩展
本文介绍了一种扩展 LDA 模型的方法,利用马尔可夫链来建模时间信息,从而用于语音信号的无监督单元发现。与基本的 LDA 模型相比,扩展后的模型可以更好地描述相邻单元之间的关系,从而得到更好的语音单元划分结果。
- 使用位置细胞学习灵活奖励寻求行为的计算理论
本文提出了一种计算理论,通过使用混合高斯分布模拟场所细胞的活动,并通过连续时间马尔科夫链的转移概率矩阵。通过学习环境与奖励的关联来提高老鼠行为的灵活性,实验结果表明,相较于深度 Q 网络处理的神经启发式强化学习算法,该理论可以显著提高老鼠学 - CVPR通过运动不确定性扩散进行随机轨迹预测
本研究提出了一种基于马尔科夫链和 Transformer 的运动不确定性扩散逆向建模框架,通过逐步放弃不可行走区域的不确定性直至到达期望轨迹,用于解决行人轨迹预测中的多模态问题,并取得了在 Stanford Drone 和 ETH/UCY - 关于连接级别段的研究
本文研究了关卡分段的生成方法,提出了一种使用马尔科夫链和树搜索算法的关卡分段链接方法,该方法可满足设计师的定制需求并保证游戏级别的可完成性和不中断的游戏结构。
- ICML应对马尔科夫数据随机优化中的混合时间
本研究提出了一种新颖的多层蒙特卡罗渐进优化方法,针对含有 Markov 链随机数据的优化问题,能够在不知道 Markov 链混合时间的情况下获得最佳渐进收敛速率,并适用于非凸优化求解及在时间差分 (TD) 学习中获取更好的混合时间依赖性。
- ICLR近线性时间内的分布压缩
介绍了一种用于加速薄算法的元措施 Compress++,其可在更短的时间内达到与输入算法几乎相当的精度。
- ImageBART: 双向上下文与多项式扩散的自回归图像合成
本文研究了基于自回归模型与多项式扩散过程结合的粗粒度到细粒度的图像语境建模方法,该方法应用于图像修改技术,较单一自回归模型在高保真度生成和图像修改能力方面有着显著提高。同时,该模型可以在压缩的潜在空间下进行高效训练,能够对于无限制的用户提供 - ICML通过 Langevin 动力学从自回归模型中进行并行灵活采样
这篇论文介绍了一种新的从自回归模型中采样的方法,提出了使用 Langevin 动力学构建马尔可夫链的方法,将采样过程并行化,并推广到有条件采样。通过将自回归模型作为贝叶斯先验,并使用条件似然或限制,我们可以控制生成模型的输出,应用这些技术于 - CVPR3D 点云生成的扩散概率模型
本文提出了一个概率模型,将点云看作是处于非平衡热力学系统内的粒子,并通过扩散过程学习将噪声分布转换为所需形状分布的逆扩散过程,即点云生成过程。具体地,将点云的逆扩散过程建模为一个以某个形状因子为条件的马尔科夫链,并提供了闭合形式的变分下界以 - 评估引理中点积分器在黎曼流形哈密尔顿蒙特卡罗中的应用
本文比较了广义 leapfrog integrator 和 implicit midpoint integrator 在 Hamiltonian Monte Carlo 中的优缺点和理论性质,并通过实验证明 implicit midpoin - Restless-UCB,在线不安定赌博机的高效低复杂度算法
提出了一种名为 Restless-UCB 的在线学习策略来解决在线探索期望最大化问题,在 Restless-UCB 中,利用前期的探索来做出更好地决策,证明了期望最大化问题在合理的标准下得到了可行的上界,相较于现有算法,使用一种新的对于状态