- 使用三目标进化算法求解动态禁制条件背包问题
研究探讨应用三目标进化算法解决具有随机和动态约束的背包问题,通过将体重和背包容量建模为随机和动态组成部分,与二目标公式相比,三目标公式在应对动态背包问题中具有明显优势。
- CVPRSingularTrajectory: 利用扩散模型的通用轨迹预测器
我们提出了 SingularTrajectory,一个基于扩散的通用路径预测框架,通过统一各种人类动力学表示,缩小了不同任务之间的性能差距。
- 多层次约束优化问题中的随机黑盒模拟器
利用 Scout-Nd 算法进行多维随机约束优化,通过有效估计梯度、降低梯度估计噪声和应用多保真度方案,减少计算工作量,在标准基准测试中验证了该方法的有效性,表现出优于现有方法的性能。
- 模仿复杂轨迹:连接低层稳定性和高层行为
我们提出了一个理论框架,用于研究非马尔可夫、潜在多模态(即 “复杂的”)专家示范在非线性动力系统中的模仿。
- 去方差加速的分散随机双正则化非凸强凸极小极大问题求解方法
提出了一种 VRLM 方法,它可以实现分布式、随机的非凸最小极大问题,使用 VR 技术达到较低的复杂度。
- 利用图神经网络将随机动态系统学习作为隐式正则化
该论文提出了一种基于 Gumbel 图网络的随机模型,能够学习高维度时间序列,捕捉随机性和空间相关性,通过 Kuramoto 的模型比较了两个损失函数的 Hessian 矩阵,实验证明该模型在收敛性、稳健性和泛化性方面都具有优势。
- 具有不对称置信区间的预算多臂赌博机
本文研究了随机预算多臂赌博问题,并提出了一种名为 ω-UCB 的新的上置信界(UCB)采样策略,该策略使用了不对称置信区间,并表明该方法具有对数遗憾且在合成和真实设置中始终优于现有策略。
- 随机人口更新在多目标进化算法中可以被证明是有帮助的
本文研究如何在多目标进化算法中引入随机性,证明了将确定性的种群更新机制替换为随机性机制可以使算法的运行时间指数级减少,实验证明了这个提出的方法的有效性。
- 基于正态映射的 Prox-SGD 方法在 KL 不等式下的收敛性
本文提出了一种新的基于随机正则映射的算法,用于非凸复合型优化问题,并讨论了其全局收敛效果及其叠加点所对应的稳态点的期望特性。
- 一种考虑长期约束条件的受限 MDPs 的最佳算法
该论文研究使用在线学习算法在约束马尔可夫决策过程中收集奖励的同时确保满足某些长期约束条件,提出了一种适用于约束性马尔可夫决策过程的最佳算法,能够管理随机和敌对条件下的奖励以及约束,并提供了理论保证。
- IJCAI大规模经验风险最小化的加速双随机梯度算法
本研究提出了一种双重随机算法,使用新的加速多动量技术来解决学习任务中的大规模经验风险最小化问题,各迭代只访问一小批样本和同时更新一小块变量坐标,从而在同时涉及海量样本大小和超高维度时显著减少了内存引用量,实证研究也说明了该方法在实践中的高效 - 交通网络的随机细胞传输模型
本文提出了一种基于偏好函数和可接受设计的随机单元传输模型的严格框架,并进行了数字实现,其中集成了仿真、高斯过程回归和随机探索程序。该方法在两个案例研究中得以验证。
- 一种高效的基于学习的二阶段直流最优潮流求解器,具有可行性保证
本文提出了一种基于学习方法的情景式两阶段随机直流最优潮流问题的解决方案,利用 gauge map 技术来解决现有方法无法实现的输出可行解的问题,并在标准 IEEE 系统上进行了模拟实验来证明其比现有方法更为高效。
- 适应离线算法来解决带有固定反馈的组合多臂赌博问题的框架
该研究针对随机、组合式多臂老虎机问题,提出了一种将离线算法转化为基于有限老虎机反馈的子线性 α 遗憾策略的框架,并将其应用于离散优化问题中的基数问题和背包约束问题中获得了良好的表现。
- 在线内容竞争决策的全动态在线选择方案
本文提出了一种针对完全动态在线选择问题的在线争用解决方案方法,并展示了如何利用该方法在部分信息模型中构建无遗憾算法。
- 随机变量度量近端梯度算法及方差约减在非凸复合优化中的应用
提出了 Perturbed Proximal Preconditioned SPIDER (3P-SPIDER) 算法,适用于解决有限和非凸复合优化问题,是随机变量度量前向 - 后向算法,提出了迷你批处理策略以减少方差并控制收敛,并通过逻辑 - 预测对冲和校准
本文提出了预测对冲的概念来提高预测准确性,通过确定性和固定点法以及随机和极小化法来区分预测对冲工具,进一步给出了连续校准的改进定义和长期股票动态,提出了一种新的标定预测程序,适用于二元事件。
- 流形插值优化传输流在轨迹推断中的应用
使用 Manifold Interpolating Optimal-Transport Flow(MIOFlow)方法,从静态快照样本中学习随机、连续的人口动态,将动态模型、流形学习和最优传输结合起来,使用神经常微分方程(Neural OD - 最佳模型选择
本文研究带有嵌套策略类别的赌场情境中的模型选择问题,旨在获得同时具备敌对和随机(“双赢”)的高概率遗憾保证。我们的方法要求每个基本学习器都带有可能或不可能持续的候选遗憾边界,同时,我们的元算法根据保持基本学习器的候选遗憾边界平衡的时间表播放 - 通过成本预算分配的层次约束随机最短路径规划
该论文提出了一种使用分层规划展开的基于成本约束的随机最短路径问题(HC-SSP)的框架,通过分支和剪枝算法来迭代地分配成本预算,从而在真实时间和风险敏感的应用中找到一个可行解。