本文提出了一种基于优化的分布参数估计和观察性社交学习方法,演示了如何使用分布式,在线的 Nesterov 双平均法解决纯粹依靠本地信息的估计,并证明了代理最终可以使用随机瓦解方案学习真实参数。
Sep, 2013
该研究旨在研究动态环境中在社交网络中学习的模型,研究了三种代理行为模型,并探讨了最优响应动态的长期影响,提出了次终极预测模型,比最优响应模型更有效。
Sep, 2011
本文提出了一个状态空间模型,将静态网络的随机块模型扩展到动态网络的建模中,并使用扩展卡尔曼滤波器配合局部搜索来拟合模型,实验表明此算法与使用马尔可夫蒙特卡罗抽样的最先进算法相竞争,但计算代价显著降低。
Mar, 2014
本文提出一种基于在线梯度下降方法的动态调参算法,以降低动态遗憾(dynamic regret),进而优化强凸且未知动力学的损失函数。
Mar, 2016
该篇论文研究了使用线性模型描述随机动态的网络 (有向图) 的学习问题,并证明了在较高采样率的情况下,利用 $\ell_1$- 正则化最小二乘算法可以高效地推断出稀疏网络结构。
Nov, 2010
使用逆问题和储水池计算,我们开发了一个无模型、完全数据驱动的框架,能够从部分状态观测实时准确追踪变化的参数。该框架在各种复杂的非线性动力系统中表现出强大的性能,并解决了影响追踪性能的相关问题。
Nov, 2023
通过研究具有状态相关噪声的随机梯度下降的动态行为,我们证明了幂律动态可以比之前的动态更快地从锐化极小值中逃脱,从而提出了一种新方法来进一步提高其概括能力。
Jun, 2020
研究异步在线学习设置和代理人网络,探讨了代理人自网络结构中获取信息的效果对后悔程度的影响。当激活是随机时,研究了代理人无需了解网络结构即可达到最优后悔。当激活是对抗性的时候,研究了代理人可以基于网络结构的信息来减少后悔的上界。
Jan, 2019
研究在流言传播模型中的分布式多臂赌博设置在 n 个。内存受限节点的人口中:在每个回合中,每个节点本地采取 m 个手臂之一,观察从手臂中获得的回报(敌意选择)分布,然后与随机抽样的邻居进行通信,交换信息以确定其在下一轮中的策略。我们引入和分析了这个任务的几族动力学,这些动力学是分散的;每个节点的决策完全是本地的,并且仅取决于最近获得的奖励及其抽样邻居的奖励。我们展示了这些分散动态的全局演化与某种 “零和” 乘性权重更新算法之间的联系,并且我们开发了一个通用框架来分析这些自然协议的种群水平遗憾。利用这个框架,在广泛的参数范围下 (即人口规模和臂数),我们推导出静态奖励设置 (每个臂的分布均值随时间固定) 和敌意奖励设置 (均值随时间可变) 的次线性遗憾界。此外,我们还表明,当奖励分布是由随机梯度量规产生时,这些协议可以近似地优化面对单纯形的凸函数。
Jun, 2023
研究信息聚合和社会学习模型,发现当个体代理通过私有观察和邻居信念的更新以及平均相信邻居来学习正确的世界状态时,使用特定的条件,代理最终会预测未来趋势并达成一致共识。
Mar, 2011