模型选择技术概述

Oct, 2018

Model Selection Techniques -- An Overview

Jie Ding, Vahid Tarokh, Yuhong Yang

TL;DR本文综述了模型选择领域的各种方法，包括统计，信息论和信号处理等方面的研究。讨论了模型选择的意义、表现和适用性，并提供了一些关于实践中的争议观点。

Abstract

In the era of big data, analysts usually explore various statistical models or machine learning methods for observed data in order to facilitate scientific discoveries or gain predictive power. Whatever data and

model selection big data statistical inference machine learning performance

发现论文，激发创造

机器学习中的模型评估、模型选择和算法选择

本文综述了机器学习中模型评估、模型选择和算法选择等三个子任务的不同技术，并讨论了每种技术的主要优缺点，给出了推荐实践建议。重点介绍了常见的模型评估和选择技术，如保留集方法和交叉验证技术，并给出了实用技巧。同时提出了多种算法比较策略，包括 5x2 交叉验证和嵌套交叉验证等，推荐在小数据集情况下使用。

Nov, 2018

语言模型数据选择调查

该论文综述了大型语言模型、数据选择方法、经验证据、大规模数据选择研究和未来研究方向的相关领域，旨在为新老研究人员提供入门点，加速数据选择领域的进展。

Feb, 2024

线性混合模型中的模型选择

本文回顾了如何利用信息标准、收缩方法、Fence 法和贝叶斯技术等四种主要方法，解决选择适当的线性混合效应模型的问题。通过考察一系列文献的方法、性质和相互关系，帮助读者更好地了解可用的方法。

Jun, 2013

特征选择：基于数据的视角

本篇综述旨在回顾并总结近年来针对传统数据、结构化数据、异构数据、流数据的特征选择算法的研究进展，以及介绍一种特征选择仓库来方便算法研究，并提出一些未来研究中需要关注的问题。

Jan, 2016

比较贝叶斯预测方法用于模型选择

该论文对比了几种在实际模型选择问题中广泛使用的贝叶斯模型选择方法，重点关注回归和分类的变量子集选择，并使用模拟和现实世界的数据进行了几次数值实验。结果表明，考虑到模型不确定性是预测效果最好的。此外，投影法明显优于交叉验证得分的基于选择的方法，并且交叉验证在指导模型大小选择和评估最终选择的模型的预测性能方面大有裨益。

Mar, 2015

特征选择调查

本文综述了不同的特征选择方法及其与机器学习算法之间的关系，阐述了特征选择在数据挖掘过程中的重要性，特别是在处理数量过多的特征时，可以降低计算负担和提高机器学习任务的准确性。

Oct, 2015

基于统计模型的主动学习

本文回顾了如何使用最优数据选择技术来优化一些类型的机器学习算法，包括前馈神经网络、高斯混合模型和局部加权回归，并探讨了此方法如何降低训练数据量，提高模型性能。

Mar, 1996

无监督机器学习模型选择中的主观性

本研究以隐马尔可夫模型为例，调查了模型选择过程中涉及的主观性，发现参与者和大型语言模型在不同的应用场景下存在选择的差异和不一致性，结果突出了在模型选择过程中制定标准化方式以记录主观选择的重要性。

Sep, 2023

在机器学习项目中，通过偏差检测拓展具有可变性感知的模型选择

该论文描述了将一个具有偏差检测的自适应可变性感知模型选择方法扩展到机器学习项目中的工作，该方法通过使用基于文献中提出的启发式方法的特征模型来对影响模型选择的因素的可变性进行建模，并在一个特定的案例研究中进行实验证明了该方法的有效性，并为机器学习项目中的模型选择提供了非特定、自适应和可解释的过程。

Nov, 2023

贝叶斯数据选择

将数据选择作为决策问题，并通过导出相应的贝叶斯准则为半监督学习中的自我训练等问题提供了贝叶斯最优选择数据的方法。根据模拟和真实数据的实证评估，我们进一步展示了该准则在广义线性模型、半参数广义加性模型和贝叶斯神经网络上减轻了确认偏差的问题。

Jun, 2024