近似最近邻搜索中超参数的高效自动调整
本文介绍一种使用邻居图和优化元启发式算法进行最近邻搜索的自动调谐算法,以自动产生品质和搜索速度的帕累托最优搜索;同时,也使用相同策略产生实现最小品质的索引。我们的方法被描述并与其他最先进的相似度搜索方法进行了基准测试,展示了便利性和竞争力。
Jan, 2022
本文演示了如何利用多智能体系统开发一个分布式技术,用于确定任意集合的超参数的近似最优值,并在机器学习和全局函数优化应用中进行了研究。研究表明,在更高的维度下,所提出的模型在分类误差和函数评估方面都优于其底层随机调优策略。
May, 2022
本文提供了一种全面的方法,用于研究超参数调整对 CART,C4.5 和 CTree 三种决策树归纳算法的影响。实验结果表明,超参数调整仅在三分之一的数据集中为 C4.5 和 CTree 提供了显著的改进,在大多数数据集中却为 CART 提供了显著的改进。不同的树算法可能呈现不同的调优场景,但总体而言,调优技术仅需要很少的迭代就能找到准确的解决方案。此外,所有算法的最佳技术都是 Irace。最后,我们发现调整特定的一小部分超参数对于可达到的最佳预测性能做出了最大的贡献。
Dec, 2018
提出一种新的无需数据空间分割的随机化算法来避免由于数据维度过高而导致的数据检索问题,并通过理论分析和实验结果来证明这种算法在数据近似性、速度和空间效率等方面优于传统的局部敏感哈希算法(LSH)
Dec, 2015
本文提出了一种基于代理的协作技术,以找到任意一组超参数(或决策变量)的近似最优值,其设计了分布式搜索操作的分层代理架构,使用基于自适应宽度的随机采样技术进行合作搜索,并在机器学习和全局函数优化应用中,通过与两种常用随机调整策略的比较得出,该模型在多维度和设备资源有限的情况下优于其他方法。
Mar, 2023
本文介绍一种基于布尔函数分析技术的超参数优化方法,应用于高维数据的神经网络训练,并借鉴压缩感知技术,仅需要均匀取样即可迭代并行计算,故速度极快。在实验中,相较于目前最好的工具,此方法能够将解决方案有效提高,且总运行时间比其他方法更快。同时,该方法具有可证明的保证且对于决策树学习具有重要意义。
Jun, 2017
该论文展示了如何使用基于代理模型的自动调整方法来解决 RandNLA 算法中参数选择的基本问题,并详细研究了基于代理模型的自动调整方法在基于随机预处理的最小二乘法中的应用。实验结果表明,我们的基于代理模型的自动调整方法可以以较少的调整成本实现接近最优的性能,同时适用于任何类型的 RandNLA 算法。
Aug, 2023
通过黑盒优化算法,本研究引入了一种方法来调整现成的基于图的索引的性能,重点关注向量的维度、数据库大小和图遍历的入口。我们将这种方法应用于 SISAP 2023 索引挑战的任务 A,在 10M 和 30M 轨道上获得了第二名,与蛮力方法相比,显著提高了性能。该研究为基于图的索引提供了一种普适的调整方法,并推广到更广泛的用途。
Sep, 2023