衡量训练数据质量的拓扑方法
介绍并解释一种基于分类性能和数据退化的相关演变来度量数据质量的新指标,该方法具有模型无关性,并通过大量的数值实验以及具有可控和可解释质量的案例详细验证了所提出度量标准的实用性。
Dec, 2023
本论文总结了在数据中心人工智能比赛中的获胜结论,提出了针对小数据集训练的质量增强方法和基于生成对抗网络的数据点生成解决方案,并指出该管道生成的数据集在比基准要小的情况下提高了 5% 的准确度。
Oct, 2021
该研究论文提出了一种基于拓扑分析的方法,用于智能制造中流质量评估的 5 级网络物理系统架构。该方法不仅可以实时监测和预测分析质量,还可以发现不同制造过程中质量特征与工艺参数之间的隐藏关系。通过应用于增材制造的案例研究,论文证明了该方法在保持高产品质量和适应产品质量变化方面的可行性。论文展示了如何有效地使用拓扑图可视化来通过流质量评估实时识别新的代表性数据。
Apr, 2024
本文提出代数拓扑作为数据复杂性量度,并通过实证分析展示了神经网络的拓扑容量在不同数据复杂度下都呈现相变现象,从而将现有理论和完全连接的神经网络架构的选择联系起来。
Feb, 2018
本文提出了一种基于拓扑数据分析的神经网络架构复杂性度量 —— 神经持久性,用于表征和监控结构特性,并通过此方法展示了 dropout 和 batch normalization 等深度学习社区开发的最佳实践。此外,还提出了一种基于神经持久性停止准则,可在缩短训练过程同时实现与基于验证损失的早停相当的准确性。
Dec, 2018
在卷积深度神经网络的内部状态上进行拓扑数据分析,以开发对其执行的计算的理解。应用此理解修 改计算以(a)加速计算和(b)改进从一组数字到另一组数字的泛化能力。分析的副产品之一是在图像数据集的新特征上产生几何体,并利用此观察结果开发出一种用于构建许多其他几何体的 CNN 模型的方法,包括由拓扑数据分析构建的图形结构。
Nov, 2018
数据驱动的人工智能系统和机器学习对我们的生活产生了巨大的影响,然而在边缘计算和物联网设备的环境下,数据质量的研究变得异常重要和紧迫。本文填补了这一领域的知识空白,提供了全球范围内从多个学科角度探讨边缘计算中数据质量的现有文献,并探讨了各个维度的详细内容和现有解决方案。
Jun, 2024