模型选择技术概述
本文综述了机器学习中模型评估、模型选择和算法选择等三个子任务的不同技术,并讨论了每种技术的主要优缺点,给出了推荐实践建议。重点介绍了常见的模型评估和选择技术,如保留集方法和交叉验证技术,并给出了实用技巧。同时提出了多种算法比较策略,包括 5x2 交叉验证和嵌套交叉验证等,推荐在小数据集情况下使用。
Nov, 2018
本文回顾了如何利用信息标准、收缩方法、Fence 法和贝叶斯技术等四种主要方法,解决选择适当的线性混合效应模型的问题。通过考察一系列文献的方法、性质和相互关系,帮助读者更好地了解可用的方法。
Jun, 2013
本篇综述旨在回顾并总结近年来针对传统数据、结构化数据、异构数据、流数据的特征选择算法的研究进展,以及介绍一种特征选择仓库来方便算法研究,并提出一些未来研究中需要关注的问题。
Jan, 2016
该论文对比了几种在实际模型选择问题中广泛使用的贝叶斯模型选择方法,重点关注回归和分类的变量子集选择,并使用模拟和现实世界的数据进行了几次数值实验。结果表明,考虑到模型不确定性是预测效果最好的。此外,投影法明显优于交叉验证得分的基于选择的方法,并且交叉验证在指导模型大小选择和评估最终选择的模型的预测性能方面大有裨益。
Mar, 2015
本文综述了不同的特征选择方法及其与机器学习算法之间的关系,阐述了特征选择在数据挖掘过程中的重要性,特别是在处理数量过多的特征时,可以降低计算负担和提高机器学习任务的准确性。
Oct, 2015
本研究以隐马尔可夫模型为例,调查了模型选择过程中涉及的主观性,发现参与者和大型语言模型在不同的应用场景下存在选择的差异和不一致性,结果突出了在模型选择过程中制定标准化方式以记录主观选择的重要性。
Sep, 2023
该论文描述了将一个具有偏差检测的自适应可变性感知模型选择方法扩展到机器学习项目中的工作,该方法通过使用基于文献中提出的启发式方法的特征模型来对影响模型选择的因素的可变性进行建模,并在一个特定的案例研究中进行实验证明了该方法的有效性,并为机器学习项目中的模型选择提供了非特定、自适应和可解释的过程。
Nov, 2023
将数据选择作为决策问题,并通过导出相应的贝叶斯准则为半监督学习中的自我训练等问题提供了贝叶斯最优选择数据的方法。根据模拟和真实数据的实证评估,我们进一步展示了该准则在广义线性模型、半参数广义加性模型和贝叶斯神经网络上减轻了确认偏差的问题。
Jun, 2024