- 偷袭计划对抗不完美观察者
隐秘规划研究使用随机动力学和不完美观察来实现最佳任务表现而不被检测到,本文引入了马尔可夫决策过程和近端策略梯度方法来解决这个问题。
- 超逆向追踪:非线性随机控制方程的深度生成建模
HyperSINDy 通过稀疏非线性动力学的识别、随机动力学的建模、变分编码器、不确定性量化等方面的进展,提供了一个有前途的框架,用于在实际系统中进行模型发现和不确定性量化。
- 多尺度储备计算学习噪声诱导的转变
利用噪声驱动的转换现象的机器学习模型,储层计算(一种递归神经网络)能够学习噪声引起的系统状态转换,通过调整关键的超参数,包括储层动力学的时间尺度,生成准确的转换时间和数量的统计数据,适用于多种系统和蛋白质折叠实验数据,表明机器学习方法可以捕 - ICML基于分数和流匹配的无模拟 Schrödinger 桥
我们提出了模拟 - free score and flow matching ([SF]$^2$M),这是一种无需模拟的目标函数,用于根据来自任意分布的未配对的源样本和目标样本推断随机动力学。
- 使用具备统计信息的神经网络学习随机动态
本文提出了名为 SINN 的机器学习框架,可以从数据中学习随机动力学,并演示了其在粗粒化问题和过渡动力学建模方面的应用及其在罕见事件模拟方面的适用性。
- 随机微分方程的可扩展梯度
本文提出一种利用伴随灵敏度方法计算随机微分方程梯度的方法,结合高阶适应性求解器,实现快速、内存高效的梯度计算。并将该方法应用于基于神经网络的随机动力学拟合中,表现出竞争性的性能。
- 深度学习理论综述:最优控制与动态系统视角
本文基于动态系统和最优控制的视角, 将现有的深度学习理论框架进行整合, 并用随机动态的优化算法作为控制器,为超参数调整提供了一个基于原则的方法。
- 透過週期性神經網路的增強學習,實現行動層次和組合的自我組織
该研究提出一种新型的多时间尺度随机循环神经网络用于强化学习,可以自主学习抽象的子目标并自我开发行为层次结构,在挑战性的连续控制任务中确保了比起从头开始训练更快的再学习。同时,研究发现,当神经活动遵循随机动态时,可以实现更好的表现。
- 视频填充的随机动力学
该研究介绍了一种随机动态视频补全(SDVI)框架,用于在视频的长时间间隔内生成帧,其中该框架将补全建模为约束随机生成过程并依次从推断的分布中采样动态。该框架包含两个部分:(1)双向约束传播模块,以保证帧间的时空一致性,(2)随机采样过程,从 - 强化学习与控制的概率推断:教程与综述
该研究介绍了一种基于最大熵的强化学习或最优控制方法,该方法在确定性动力学和随机动力学方面分别相当于精确概率推断和变分推断,并探讨了相关算法和未来研究方向。
- 社交群体中的分布式学习动态
本文对某些动物群体和人类群体中观察到的分布式学习过程进行了研究,得出这种学习是一种简单启发式方法,有效识别最佳选项并在整个群体中执行得到优化结果。
- 图上随机动力学的变分逼近
本文基于群集变分方法探究解析图形随机动力学的近似模型及模拟方法。
- NIPS从局部观测重建传播模型参数
本研究提出了一种高效的动态信息传递算法,可以在只有网络中节点活动时间的部分信息的情况下重建传播模型的参数。该方法适用于大量的动态模型和时间图案例。
- 随机漫步,马尔可夫过程和复杂网络的多尺度模块化组织
该论文提出了一种基于 Markov Stability 的动态社区检测框架,该框架可以通过时间参数化函数自动查找在不同分辨率下的社区结构,并且能够高效地在大型网络中应用。
- 利用自然多样性重建传播网络并识别隐藏源
本研究提出了一种基于压缩感知的框架来重建随机扩散动力学下的复杂网络,并应用到模型和真实网络中。研究表明,从少量二元数据可以实现不均匀交互的全面重建。此外,该方法还可以确定并高度可信地定位隐含的触发扩散过程并在其外部不可访问的源,从而为追踪和 - 带主次智能体的非线性随机动力系统的 ε-Nash 均场博弈理论
研究了一种大规模人口动态博弈,涉及非线性随机动力学系统,通过 ε-Nash 平均场博弈理论解决了被混合代理 MFG 问题,其中即使在渐近情况下,主代理的噪声过程也会引起次要代理的均值场行为的随机波动,该问题被拆分为两个非标准随机最优控制问题 - NIPS随机微分方程网络学习
该篇论文研究了使用线性模型描述随机动态的网络 (有向图) 的学习问题,并证明了在较高采样率的情况下,利用 $\ell_1$- 正则化最小二乘算法可以高效地推断出稀疏网络结构。