通过将现有算法从顺序设定应用到分布式设定,仅利用恒定数量的MapReduce循环,在许多设置中实现了接近最优的近似比率。我们的技术还为满足矩阵约束的非单调最大化提供了快速的顺序算法。
Jul, 2015
该论文提出了首个一次遍历的流算法,用于求解子模最大化问题,采用数据采样,能够在各种情况下获得最紧密的逼近保证,同时具有最小的内存占用和对函数评估数量的最低要求,试验表明该算法在进行大规模机器学习问题的子模最大化时能够将其表现提高50倍以上
Feb, 2018
该论文研究设计了一种流式亚模量最大化算法SALSA,用于提取数据多样性、非参数学习、核机器、聚类等方面的大规模数据集的代表性摘要,取得了比现有算法更好的近似效果。
Aug, 2018
该研究提出了针对单个和多个背包约束下的单调次模最大化的首个对抗鲁棒算法,具有可扩展的分布式和流式实现。性能评估结果表明,与现有非鲁棒算法的自然鲁棒化相比,该算法对于大型社交网络图等输入具有最佳的目标结果,并表现出极强的性能,即使与提前给出拆除集合的线下算法相比也是如此。
May, 2019
本研究旨在探究在数据流中从每个数据组中提取一定数量的代表项目的问题,并提出了一种公正的约束模型和有效的解决方案。该解决方案在最大化覆盖面和个性化推荐方面具有实际应用和较高的性能。
Oct, 2020
通过开发近似算法解决具有组内公平性约束的单调子模函数最大化问题。
Apr, 2023
本文提出了一种新型的随机子集选择框架,用于解决机器学习算法中存在的偏见或歧视问题,该框架结合了群体公平和最优化的因素,具有广泛的应用前景和优化效果。
本研究提出一种算法用于在考虑限制因素的情况下,最大化一类亚模模函数。算法能够保证在该模函数家族下,输出子集的效用最优,并均衡代表每个子集组。
May, 2023
本文提出了单遍流式和在线算法的受约束k-次模最大化,其中包含基数和背包约束限制,该算法可以提供不错的近似解和高效的解决方案,并在广告分配等应用实例上得到了验证。
在机器学习中,基于 matroid 约束的子模最大化是一个具有各种应用的基本问题。最近,已经在有限制条件下的流式和离线设置下考虑了基于基数约束的子模最大化中的公平性,但对于更一般的 matroid 约束问题,只有在流式设置下且只考虑单调目标。本文通过提出各种算法和不可能性结果,在质量、公平性和广泛性之间提供了不同的权衡。
Dec, 2023