- CVPR目标检测的核心集选择
使用 Coreset Selection for Object Detection (CSOD) 方法,在考虑代表性和多样性的前提下,选择一小部分具有代表性和多样性的图像,以提高目标检测的准确性。
- AAAI深度特征的贡献维度结构对于核心集选择的影响
通过引入一种新的贡献维度结构 (CDS) 度量,我们的方法增强了五种经典选择方法,提高了模型的性能。在三个数据集上的实验表明,我们的方法对现有方法具有普遍的有效性。
- 分布式学习的梯度核心集
基于梯度的鲁棒高效联邦学习(GCFL)算法提出了一种在每 K 轮通信选择 coreset、从 coreset 中获取更新的方法,以账单客户数据噪声。实验证明 GCFL 相较于 FL 更具计算和能耗效率,对特征和标签的各种噪声具有鲁棒性,且保 - 具有优先多目标的核心集选择
深度学习算法中,通过核心集选择来减少计算成本和加速数据处理。在满足模型性能的前提下,通过优先级顺序,我们提出了一种创新方法来选择尽可能小的核心集,以更低的成本和更高的加速度实现更好的模型性能。
- D2 剪枝:数据剪枝中的信息传递平衡多样性和难度
通过使用 D2 修剪算法,将数据集表示为无向图,并进行前向和反向消息传递,综合考虑数据的多样性和难度评分来选择 Coreset,该方法在多个视觉和语言数据集上超越了现有最先进方法的 Coreset 选择效果,对于剪枝率高达 70%,使用 D - RK-core: 数据集中层次结构探索的已建立方法学
最近,机器学习领域已经从以模型为中心转向以数据为中心,通过积累更广泛的数据集,便于在这些数据集上训练更大型的模型,我们引入一种先进的方法 RK-core,以增进对数据集内复杂的层次结构的更深入了解。我们发现,核心性值较低的样本在各自类别中具 - 用可证明的泛化加速量子机器学习模型的核心选择
通过选择核心集合来优化量子神经网络和量子内核的训练效率,研究分析了通过核心集合训练的量子神经网络和量子内核的泛化误差界限,并通过数值模拟揭示了核心集合选择在合成数据分类、量子相关性识别和量子编译等任务中的潜力。该研究提供了一种改进多样的量子 - 通过不确定性估计进行最佳样本选择及其在深度学习中的应用
通过开发一个新的算法 COPS,我们提出了一个理论上最佳的解决方案,以最小化从样本数据训练的模型的预期损失。我们的方法在深度学习任务中可以有效地应用,通过使用模型的对数几率来估计采样比例,并通过低密度样本的降权方法来解决模型对错误规范的敏感 - 自适应核心集选择的高效量化感知训练
本文提出一种基于 coreset selection 的 quantization-aware adaptive coreset selection (ACS) 方法,以提高 quantization-aware training 的训练效 - 重复随机抽样减少学习时间达到准确性
本文研究了训练神经网络的数据选择方法,提出了一种名为 RS2 的方法,利用随机抽样的方式显著提高了数据训练的效率,并在四个数据集上得到了验证。
- 概率双层核心集选择
本研究提出了一种连续概率双层形式的核心集选择方法,通过学习每个训练样本的概率权重,该方法在标签噪声和类别不平衡情形下表现出优越性。
- ECCV高效鲁棒训练的对抗样本核心子集选择
通过核心集选择的方法,使用梯度近似误差作为对抗对策核心集选择目标实现对训练集大小的有效减少,以加快对抗训练 2-3 倍。
- DeepCore: 深度学习中数据子集选择的全面库
本文提出 DeepCore 库,并对目前主要的 coreset 选择方法在 CIFAR10 和 ImageNet 数据集上进行了实证研究,结果表明,虽然各种方法在某些实验设置上具有优势,但随机选择仍然是一个强有力的基准。
- ECCV∞范数的健壮性与更多因素:高效对抗训练技术的实现
本篇论文阐述了对于神经网络存在攻击的情况下,如何通过对抗训练和小样本训练方法,提高模型的鲁棒性。
- RETRIEVE:高效和鲁棒的半监督学习中的核心子集选择
本文提出 RETRIEVE:一种半监督学习的特征选择框架,通过解决混合的离散 - 连续二层优化问题以使选择的特征组合最小化标记数据的损失。实验结果表明,使用 RETRIEVE 能够显著提高半监督学习的运算速度并在存在 OOD 数据和不平衡数 - ICML对称张量分解的流式核心集
本研究重要的优化模块是张量分解,特别是在潜变量模型中。作者介绍了两种新的算法技术:在线过滤和核化,并提供了六种算法来实现不同的核心集大小、更新时间和工作空间的折衷方案,以击败或匹配各种现有算法。在矩阵的情况下,作者的在线行采样算法保证了(1