- QCore: 高效、设备端的量化模型持续校准 -- 扩展版本
为了在边缘设备上连续校准量化模型以适应动态环境,本文提出了 QCore,通过对完整的训练数据进行压缩并使用小规模位翻转网络来更新参数,实现有效的连续校准。使用实际数据进行的实验研究显示 QCore 能够胜过强有力的基准方法。
- 用模型遗忘方法提升生成式类增量学习性能
本研究通过引入遗忘机制,提出了一种新颖的生成类增量学习(GCIL)方法,旨在动态管理类信息以更好地适应流数据。通过实验证明,将遗忘机制整合到 GCIL 中,显著提高了模型在获取新知识方面的性能,凸显了策略性遗忘在不断学习过程中的积极作用。
- ActDroid:一种用于 Android 恶意软件检测的主动学习框架
Android 恶意软件检测:使用在线学习处理流式数据问题,提高分类精确性和标记效率,并探索不同静态、动态和混合特征集在恶意软件分类中的权衡。
- 流式因子轨迹学习用于时态张量分解
提出了一种能够处理时间信息的流式数据的张量分解方法,使用高斯过程模型因子轨迹并通过构建等效的随机微分方程实现在线过滤估计,有效捕捉对象表示的时序演化。
- 具有差分隐私的数据分析
本论文利用差分隐私算法对分布式和流数据进行分析,通过学习全局数据模型并保障差分隐私,提出了三种分布式学习贝叶斯网络模型的新方法,并针对流数据中的用户密度估计问题,提供了用户级别的隐私保护算法和改进策略。
- DataCI: 一个用于流式数据的数据中心人工智能平台
DataCI 是一个为动态流数据场景下的数据中心人工智能而设计的全面开源平台,提供了 API、版本控制等丰富的功能,具有易用性和高效性,并有望在流数据背景下改革数据中心人工智能的实践。
- ICML公平但渐进式相等的协同学习
本篇论文主要探讨基于探索和开发的 incentivization 设计方法,处理在协作学习使用流数据时,公平性和资源分配不平衡问题。该方法确保节点仅根据其贡献程度获得奖励,并且采用渐进平等的机制,保持资源不足节点和资源充足节点的学习效果相等 - SIGIR始终强化优势:基于漂移感知的增量学习框架用于 CTR 预测
本文提出了一种基于集成学习的漂移感知增量学习框架,通过明确基于错误的流数据漂移检测,进一步加强适应良好的集合,并冻结不匹配的集合,避免了灾难性干预,从而解决了 CTR 预测中的灾难性遗忘问题。离线实验和 A/B 测试结果表明,该方法优于所有 - 学习内插以获得更好的流量分位数近似和最坏情况的保证
应用插值技术解决流数据的分位数草图问题,以在保持最坏情况下相似保证的同时,尝试获得比 KLL 在实际数据集上更好的近似。
- 流数据的主动成本感知标记
研究主动标注流数据的问题,提出了一种基于确定性阈值和时间成本依赖性阈值的算法,并考虑了数据输入属于离散或连续域的情况,得到了上限约束模型。通过模拟实验,并在医学和天文学领域进行实际测试,证明了该算法在实验结果上的优势。
- 半参数语言模型是可扩展的持续学习者
本文提出了一种名为 Selective Memorization 的方法来提高半参数语言模型在不断学习流数据时的可伸缩性,该方法只记忆模型难以处理的样本。实验表明,Selective Memorization 能够实现半参数语言模型的可扩展 - CERiL: 连续事件强化学习
这篇论文探讨了事件相机在连续时间强化学习方面的潜力,并介绍了一种基于事件流的训练方法,即 CERiL 算法,该算法使用专门的网络层直接在事件流上操作,从而优于传统的基于 RGB 图像的方法。
- 学习 “O” 有助于更多的学习:处理隐含实体问题的类增量 NER 算法
本研究探索了类增量 NER 中的隐藏实体问题,并提出了一种基于重演的表示学习方法,既可以适当地学习旧实体类的 “O” 类,也可以学习新实体类的 “O” 类,通过实验验证了提出方法在多类增量 NER 上的有效性。
- KDDSECLEDS: 基于多个中心点和中心点投票法的数据流序列聚类算法
该论文提出了一种流式 k-medoids 算法的变种 SECLEDS,它使用多个质心聚类,通过中心投票方案处理数据流中的概念漂移,以实现高效的序列聚类,同时提高聚类的质量和稳定性,并证明了其在网络流量聚类中的较高性能。
- ICML关于私人在线凸优化:在 $l_p$ 几何和高维情境赌徒中的最优算法
研究了使用差分隐私保护的在线随机凸优化问题,提出了一种具有递归梯度的私有在线 Frank-Wolfe 算法,可在线性时间内实现最优超额风险,并证明递归梯度的方差缩减结果在非平稳场景下也有理论保证。同时,该算法也被扩展到 p=1 的情况,可实 - IJCAI在线轻量级混合表示学习:在视觉跟踪中的应用
本文提出了一种新的混合表示学习框架,该框架可以针对流数据进行处理,其中视频中的图像帧由两个不同的深度神经网络集成模拟;一个是低位量化网络,另一个是轻量级全精度网络,前者以较低的成本学习粗略的主要信息,而后者则提供了能够还原表示的高保真度的剩 - ICLR重新思考流式机器学习评估
探讨了流式机器学习问题的本质,阐述了延迟标签等实际挑战,建议采用新的性能度量标准来评估模型。
- ICLR无限非平稳聚类的流式推断
本文提出了一种新的聚类算法,利用动态中餐馆过程(Dynamical CRP)来处理非平稳的流数据,并展示了在多样化数据集中实施的实验结果。
- ACLELLE: 面向新兴数据的高效终身预训练
本研究提出了一种名为 ELLE 的模型,旨在通过 PLM 扩展和预训练域提示来实现高效的终身预训练,从而适应不断增长的流式数据,并在 BERT 和 GPT 上进行了实验,结果表明在预训练效率和下游性能方面 ELLE 优于各种终身学习基线。
- AAAIDDG-DA:用于可预测概念漂移适应的数据分布生成
本研究提出了一种基于 DDG-DA 的预测建模方法,结合对数据演化的预测和生成的方法,能够有效应对概念漂移,提高预测性能。