- 度量空间内高效无模型强化学习中的缩放
该论文提出了 ZoomRL 算法,应用于连续状态 - 动作空间中的序列强化学习问题,通过自适应离散化来平衡开发与探索并获得良好的性能保证。算法可以达到最坏情况下的复杂度 $\tilde {O}(H^{rac {5}{2}} K^{rac - AAAI上下文词嵌入的逐步语义权重训练
本研究提出一种新颖的在线算法,通过最小化上下文嵌入组内的距离来学习单词嵌入中每个维度的本质,以三种最先进的基于神经网络的语言模型 Flair、ELMo 和 BERT 生成上下文嵌入,为同一词汇类型生成不同的嵌入,这些嵌入由 SemCor 数 - ICCV在线去噪正则化在相位恢复中的应用
本文研究正则化去噪技术在大型数据集下的应用,提出了一种在线正则化去噪算法(On-RED),并证明了在凸优化情况下的理论收敛性及对非凸问题的有效性,结果表明 On-RED 是一个有效的解决大型数据集问题的技术。
- 带有辅助信息的在线矩阵补全
本文研究了在线的二进制矩阵完成算法,证明了相应的错误界和遗憾界。同时,通过引入最大化边界变量 γ 和拟维数项 D,衡量了与边缘和附带信息的质量和数量相关的算法结果。
- 边缘服务预算约束下的需求估计与贝叶斯赌博学习
本研究提出一种基于上下文的在线算法,称为 COERR,用于边缘资源租赁问题,以在预算有限的情况下最大化 ASP 的效用,并通过一系列实验检验了其可行性。
- 随机线性赌博机的扰动历史探索
提出了一种新的在线算法 LinPHE,用于最小化随机线性赌博机中的累积遗憾,该算法通过构建扰动历史来达到目的,并获得了关于线性模型的高性能预测模型,在包括逻辑回归模型的各种场景中都具有可行性。
- 面向位置感知移动边缘缓存的内容流行度预测
本文提出了一种基于位置定制的缓存方案,使用线性模型估计未来内容命中率,并以此为基础提出了求解最优缓存策略的不依赖于训练的在线算法,实现了自适应缓存决策并达到了与最优策略相当的命中率。
- 在线和滑动窗口模型下的近似最优线性代数
本研究讨论了滑动窗口模型下的数值线性代数问题,提出了基于行采样的框架并使用随机化算法求解谱逼近、低秩逼近 / 投影成本保持、基于 l1 范数的子空间嵌入等问题,同时通过与在线模型的联系,提出了正文算法,并应用于列 / 行选择、主成分分析等问 - 密集网络中移动边缘计算的联合服务缓存和任务卸载
本文提出了一种名为 OREO 的基于 Lyapunov 优化和 Gibbs 采样的在线算法,用于动态服务缓存和任务卸载,以应对 MEC 系统中的关键挑战,包括服务异构性、未知系统动态、空间需求耦合和分散协调,可有效降低终端用户的计算延迟并保 - 追寻汉字输入法引擎中的松散字生成规则
本研究提出了一种自动词汇获取方法,通过引入松散的词概率度量来度量一个字符序列可以被用户识别为单词的概率,并通过在线算法来调整词概率或生成新词,展示了性能接近高度优化的带有固定词汇表的输入法引擎的实验结果。
- MNL-Bandit: 一个动态学习方法用于选品
本论文提出一种动态选货方案,使用多项式逻辑选择模型并同时探索和开发以达到近乎最优的性能,可在不知道时界长度的情况下进行完全在线实现,并且在良好分离的情况下以及分离不成立的一般参数设置下的表现也接近最优。
- ICCV在线实时多时空动作本地化和预测
本研究提出了一个深度学习框架,可实时进行多个时空动作的本地化、分类和早期预测,通过实时的 SSD 卷积神经网络进行回归和分类检测,再通过一个高效的在线算法构建和标记动作管道以进行实时分析,对于 S/T 动作本地化和早期动作预测在 UCF10 - WSDMRedQueen: 社交网络智能广播的在线算法
本研究基于 jump stochastic differential equations 算法提出了一个名为 RedQueen 的在线算法,通过控制用户在社交网络上发布帖子的时间,使之能够一直停留在他们关注者的动态列表的顶部,实现用户帖子的 - 高维稀疏 PCA 的在线学习:精确动态和相变
研究基于在线 PCA 和逐元素非线性的算法对于稀疏主特征向量的学习,证明其在高维极限下收敛于确定性的,尺度测度过程,同时证明在稀疏支持恢复中有良好的表现,并通过非线性 PDE 的稳态分析揭示了有趣的相变现象。
- ECCV动态特征选择过程中的目标跟踪
DFST 提出了一种基于实时选择本地和时间上有区别的特征的优化视觉跟踪算法,该算法嵌入了自适应颜色名称(CN)跟踪系统中的特征选择机制,同时采用无监督方法 “Infinite Feature Selection”(Inf-FS)来排名特征, - MM持续冷启动的在线物品推荐增量分解机
本文提出了基于增量因式分解机的在线项目推荐方法,能够有效解决用户和项目动态变化的推荐问题,具有较高的可行性和性能表现,是进一步发展生产推荐系统的有前途的基础。
- 可证明高效的在线矩阵完成算法:非凸随机梯度下降
该研究提出了一种可证明,高效的在线算法,用于矩阵完成问题。该算法使用随机梯度下降,具有快速的更新时间,并可自然地用于离线设置。
- 跳着走!多尺度网络嵌入的在线学习
我们提出了一种名为 Walklets 的算法,通过子采样短的随机游走,在图的顶点之间建立多尺度关系,从而生成多维表示,用于社交网络等多标签网络分类任务,其效果优于 DeepWalk 和 LINE 等方法,且为在线算法,可轻松扩展到数百万个顶 - 在线行采样
本研究提出了基于杠杆得分的矩阵逼近的简洁、直观的在线算法,允许比以前的工作更低的内存使用,并暴露了新的理论性质。
- MM在线主成分估计的近最优随机逼近
本文将在线 PCA 转化为随机非凸优化问题,并将在线 PCA 算法分析为随机逼近迭代。在亚高斯假设下,我们证明了在线 PCA 算法的近乎最优有限样本误差界限,并且表明有限样本误差界限与极小信息下界紧密匹配。