- ICML针对昂贵的多目标组合优化问题,训练贪婪策略用于提案批量选择
在昂贵的多目标组合优化问题中,积极学习被越来越多地采用,但它涉及一个具有挑战性的子集选择问题,即优化批量采集评估的好坏量化指标。为了管理庞大的搜索空间,我们引入了一种新颖的贪婪式子集选择算法,通过基于贪婪策略的顺序贪婪采样,直接在组合空间上 - 神经网络修剪的有效子集选择
在一些领域(如医学数据)中,有大量的标注数据对于深度神经网络的效果至关重要。为了明智地选择待标注的数据(即子集选择问题),我们研究了子集选择和神经网络剪枝之间的关系,并建立了它们之间的联系。借鉴了神经网络剪枝的见解,我们提出了利用神经网络特 - 带有错误分类惩罚的假设检验的子模块信息选择
选择最佳的信息源子集,以便在有限假设集合上,基于有限样本观察结果,从事实世界的真实状态中识别出正确的假设。使用误分类惩罚框架来描述学习性能,并研究了两种情况下的子集选择问题:(一)选择最小成本的信息集合以保证在将真实假设错误分类的最大惩罚保 - CVPRFlashEval:面向快速准确的文本到图像扩散生成模型评估
近年来,文本到图像生成模型的发展取得了显著进展。我们提出了一种评估效率的方法,通过选择文本 - 图像数据集的代表性子集来改善模型评估过程。我们研究了设计选择,包括选择标准和选择粒度,并提出了一种名为 FlashEval 的迭代搜索算法。在 - 分布式基于配对次模函数的大于内存子集选择
通过提出一种新颖的分布式界限算法,并使用多轮基于分区的分布式贪心算法,此论文解决了子集选择问题,能够在没有或极小损失质量的情况下,找到高质量的子集。
- 针对数据子集选择的次模信息度量的理论分析
通过导出与相关性和目标数据的覆盖相关的数量的相似性为基础的上下界,我们首次提供了关于 Submodular Mutual Information(SMI)在子集的相关性和覆盖范围方面的理论保证,展示了 SMI 函数在实现良好的查询相关性和查 - 最佳子集选择的动态增量优化
本研究探讨了一类 l0 正则化问题的对偶形式,并基于其原始问题和对偶问题结构开发了一种高效的原始对偶算法,通过利用对偶范围估计和增量策略,可能减少了冗余计算并改进了最佳子集选择的解决方案。理论分析和对合成数据集和实际数据集的实验验证了所提出 - 一种基于加权 K-Center 算法的数据子集选择
基于深度学习的子集选择方法,通过结合高不确定性的边缘采样和多样性聚类方法的加权和来计算子集,并通过并行算法在大数据集上取得了类似或更好的性能表现。
- ICML存在偏差的多个排序基础下的子集选择:公平约束对多赢家投票评分函数的效果
本文通过研究 subset selection 问题中的系统性和无意识偏见,探讨了在加入公平性约束条件下如何提高选择结果的质量,发现这与使用 multiwinner 得分函数的方式有很大关系,有些函数只需要少量排名即可达到近似最佳解,而对于 - 在有偏差的情况下最大化子模函数进行推荐
本研究提出一种算法用于在考虑限制因素的情况下,最大化一类亚模模函数。算法能够保证在该模函数家族下,输出子集的效用最优,并均衡代表每个子集组。
- 超越次模性:带团体公正约束的随机集合选取统一框架
本文提出了一种新型的随机子集选择框架,用于解决机器学习算法中存在的偏见或歧视问题,该框架结合了群体公平和最优化的因素,具有广泛的应用前景和优化效果。
- 使用代理模型识别多任务学习中的负迁移
本文提出一种通过代理模型解决多任务学习中子任务选择问题的方法,该方法使用线性回归模型预测未见过的子任务组合的性能表现,利用其提供的子任务与目标任务的相关性分数进行选择,可以更准确地预测负面转移,并显著提高现有多任务学习算法的性能。
- MILO: 用于高效模型训练和调整的模型无关子集选择框架
提出 MILO 模型 - 无模型依赖子集选择框架,分离子集选择和模型训练,使用简单的至难课程表实现了更好的模型收敛和性能,能够使模型训练速度提高 3-10 倍,超参数调优速度提高 20-75 倍。
- 基于 $α$- 核心的在线子集选择算法,无需增广遗憾
本研究提出了一个名为 SCore 的在线学习策略,用于解决一类奖励函数下的最优子集选择问题,并引入了一种新的性能度量标准,即 α- 增强遗憾。研究表明,包括子模函数在内的大类奖励函数,都可以通过 SCore 策略进行高效优化。
- 学习可解释的决策规则集:一种次模优化方法
本文介绍了一种基于子模优化的学习规则集的方法,将子问题转化为特征子集选择任务并利用子模函数差值的思想使得问题更易解决,实验结果表明这种方法简单、可扩展且具有较好效果。
- 弱监督训练子集选择
本篇论文研究了弱监督机器学习方法,提出了利用预训练数据表示结合剪枝统计学方法选择高质量弱标签数据的子集,优化了弱监督模型的表现,提升了 19% 的准确率。
- 透过覆盖镜头实现主动学习
通过覆盖方法,基于深度主动学习的 ProbCover 算法在低预算情况下,利用表征学习和自监督学习的最新进展进行子集选择,从而最大程度地提高了覆盖概率,进而在图像识别基准测试中显示出比现有方法更好的性能,特别是在半监督设置下。
- 演化多目标优化中大型候选解集的子集选择基准测试
本文旨在填补演化多目标优化领域中子集选择策略研究缺口,提出基于大型候选解集的子集选择基准测试套件,并使用该测试套件比较一些典型方法。
- CVPR基于多标准的凸在线视频帧子集选择技术对自动驾驶数据的高效处理
本文研究了如何用数据更加高效地训练自动驾驶系统,并提出了一种基于凸优化和次模优化的在线视频采样方法,该方法仅保留对应关键场景,实验结果表明,在最困难的转弯任务中,该方法可以舍去 80% 的数据,但是能够保留学习模型所需要的重要特征,从而加快 - AAAIPRISM: 一类富参数子模信息度量函数用于引导子集选择
通过新的函数和其参数化方法,PRISM 提供了多种建模能力,可以在所选择的子集的多样性、代表性和与数据点集的相似性 / 不相似性之间实现权衡,本文对两个实际问题进行了演示,结果显示 PRISM 在有针对性的学习和图像概述方面的性能优于最先进