- 分布偏差对留一交叉验证的影响
通过研究我们发现,在机器学习模型的性能评估中,交叉验证方法会引入分布偏差现象,导致性能评估及超参数优化受到负面影响。为了解决这个问题,我们提出了一个通用的校正分布偏差的交叉验证方法,并通过合成模拟和多个已发布的实验验证结果。
- 交叉验证的离策略评估
本文研究了离策略评估中的估计器选择和超参数调优问题,并展示了如何使用交叉验证来解决这一问题,从而验证了交叉验证在离策略评估中是可行的。
- 不要浪费时间:早停止交叉验证
使用早停法进行交叉验证的模型选择,可以更高效地收敛,涵盖更多搜索空间,并实现更好的性能。
- 利用对抗验证量化地理空间机器学习预测的差异性
通过对地理空间机器学习预测结果和样本数据之间的差异度进行量化,在 0 到 100% 的区间内,基于对抗验证的方法可以准确度量差异度。此方法在合成和真实的数据集上测试,并逐渐增加差异度来研究其效果和普适性。测试结果表明该方法可以成功地量化整个 - 基于实证方法的点尺度土壤湿度测量的空间模拟和卫星反演评估
基于融合时空信息与机器学习的方法,将点尺度的土壤湿度(SM)测量从 28 个点位上采样到 100 米的分辨率,实现了较为公平和统计学上更可靠的比较评估,并在交叉验证的基础上验证了该方法对未覆盖点位的区域的湿度空间变化的映射能力。
- 临床机器学习中多源交叉验证的实证研究
在这项研究中,我们对多源数据环境下的标准 K 折交叉验证和留源交叉验证方法进行了系统的实证评估,考虑了基于心电图的心血管疾病分类任务,并将 PhysioNet CinC Challenge 2021 和山东省医院的公开可用数据集进行了整合和 - 后选择和深度学习中的不端行为
这篇论文揭示了机器学习中的深度学习不当行为和后选择的问题,并证明了采用交叉验证方法对数据进行划分并不能免除后选择中的作弊和隐藏行为。
- 简化交叉验证:高效地导出列向正规化和标准化的训练集 X'X 和 X'Y,避免全量重新计算矩阵乘积或统计矩
本文介绍了三种有效计算未见数据集上预测模型性能的算法,它们在计算复杂度和正确性方面表现优越,并且相比于直接交叉验证和快速交叉验证的先前工作,它们提供了显著的交叉验证加速,而无需数据泄漏。同时,本文还重点介绍了这些算法与改进的 Kernel - 交叉验证合规风险控制
基于交叉验证的新型决策风险控制(CV-CRC)方法确保了一组从点预测器中提取的预测器的校准性,减少了数据集分割限制并降低了平均集合规模。
- 高斯图模型结构学习中交叉验证的不一致性
通过理论分析和实证研究,我们揭示了交叉验证在高斯图模型中泛化有限,并通过与其他常用信息准则进行对比,揭示了这种不一致性。这对于需要超参数选择的图模型结构学习算法来说具有重要意义。
- 交叉验证与突变验证在模型选择中的经验比较
通过比较变异验证方法和 k 折交叉验证方法,我们发现两种方法在选择模型的泛化性能上表现相当,但变异验证方法在选择简化模型和计算成本方面具有优势。然而,在某些情况下,变异验证方法选择过于简化的模型,导致欠拟合,并在超参数选择方面表现不稳定。
- Julearn: 机器学习模型的无泄漏评估和检查的易用库
机器学习在神经科学中的应用是一个具有挑战性的领域,本文介绍了 julearn 这一开源 Python 库,用于设计和评估复杂的机器学习流程,以简化研究项目中常见的陷阱。
- 测试二元分类问题的性能得分的一致性
在本文中,我们引入了一种数值技术来评估报告的性能分数和假设的实验设置的一致性,通过三个与医学相关的应用程序,我们展示了这种方法如何有效地检测不一致性,从而保护研究领域的完整性。
- 无监督学习纳米压痕数据以推测复杂材料的细微结构细节
通过纳米压痕研究了 Cu-Cr 复合材料,使用无监督学习的高斯混合模型分析大量数据集,确定了多个机械相和相应的机械性能,并引入交叉验证方法来解决在材料科学机器学习中常遇到的数据数量和可靠预测问题。
- 交叉验证独领风骚:一种统计学方法用于标签噪声估计
提出了 Repeated Cross-Validations for label noise estimation (ReCoV) 方法,在医学影像结果预测数据集中表现出比现有算法更好的噪声清理能力。
- 高维回归中基于生成数据的对抗训练:渐进研究
本文对高维线性回归中采用伪标签和真实或生成的数据进行的双阶段对抗性训练方法进行了理论分析,证明了该方法可通过适当的 L2 正则化来避免 Ridgeless 训练中的双下降现象,从而提高模型性能,并推导了适用于该方法的快捷交叉验证公式。
- 方阻交叉验证:一种精确高效的超参数调优方法
本文介绍了一种名为 Blocked Cross-validation(BCV)的新方法,在超参数调整方面比传统的 Repeated Cross-validation(RCV)提供更精确的错误估计,即使运行的数量显著减少,也能实现更高的准确度 - 子采样岭回归集成:等效性和广义交叉验证
本研究探讨了在比例渐近情况下,基于子采样的岭回归集成,通过分析岭回归集合的平方预测风险,证明了岭无偏估计器的预测风险与含所有可能子样本的完整无岭集合的预测风险相匹配,并证明了广义交叉验证对于估计岭回归集成的预测风险具有强一致性。
- QUST 参赛队在 SemEval-2023 任务三中:检测在线新闻体裁、框架和说服技巧的单语和多语方法的综合研究
这篇文章讲述了 QUST 团队参与 SemEval2023 任务 3 的情况,使用多语言模型并结合类权重和样本权重进行 fine-tuning,采用任务不相关和任务相关的两种微调策略,在 10 倍交叉验证下,多语言方法表现优于单语言方法,在 - 基于块正则化的 5×2 交叉验证 McNemar 检验:比较两种分类算法
研究比较了两种分类算法,并提出了一种基于 block-regularized 5x2 CV 的 McNemar's test,通过多次重复,减少训练集变化对错误率估计的影响,从而有效增强了统计功效。