人工智能中的镜中镜效应:如何预测应用于超参数调整的神经网络的准确度
本文提出一种基于图神经网络的 Hypernetwork 模型,可以利用已经训练好的神经网络的知识,直接预测神经网络参数,实验结果表明,该模型可以在 CPU 上在秒级时间内预测具有很高的精度和泛化能力,通过该模型的应用,可能开启训练神经网络的新篇章。
Oct, 2021
该研究提出了一种新的深度神经网络准确性预测器,可以预测未知输入数据集的分类性能,在不需要任何训练的情况下,在单个 GPU 上每秒超过 100 个网络,大规模架构搜索只需要几分钟。
Jun, 2018
本文介绍了一种基于神经网络的精度监测模型,可用于监测深度神经网络的真实推断精度,并提高深度神经网络在安全关键应用中的可信度。我们的方法对于图像分类和交通标志检测等多个数据集有效。
Jul, 2020
本文提出了一种利用标准频率回归模型通过网络架构、超参数和时间序列验证性能数据来预测部分训练模型配置的最终性能的方法,并证明该方法在视觉分类和语言建模领域中是有效的。同时,我们提出了一种早期停止方法,可用于超参数优化和元模建模,加速了模型配置的优化过程,该方法在强化学习 - based 架构选择算法和基于贝叶斯思想的搜索方法中均可无缝集成。
May, 2017
通过将一个 ensemble 中的知识压缩成单个模型的方法,我们可以显著提高基于 MNIST 数据集的模型性能并将这种方法应用于商业系统的声学模型,同时我们还提出了一种由专家模型和完整模型组成的新型 ensemble。
Mar, 2015
本研究关注于应用预测几何模型于机器学习中时所面临的稳定性和方差问题,并通过分析诸如单个数据点、逼近方法和参数设置等特征对基于 word2vec 的推荐系统几何模型进行调整和优化,以实现对大规模数据点的信息价值检测。
Jul, 2018
本文考虑了通过监督学习来学习期权价格或隐含波动率的问题,并发现在所选择的网络体系结构方面使用广义高速公路网络的精度比其它变体高,对于计算隐含波动率,采用变换后的 DGM 架构是最优的。
Jul, 2023
我们提出了 DAIC(DNN 评估和改进周期)方法,结合 “低成本” 在线伪预测和 “高成本” 离线抽样技术来估算和提高 DNN 系统的操作准确性,并将它们整合到 DNN 系统的迭代生命周期中。
Mar, 2023
基于部分结果和功能策略,引入了一种算法来估计整个训练数据库中学习曲线的演变,迭代逼近所需时间的值,独立于学习技术的使用,并且在经过预测级别后,被证明在工作假设方面是正确的,使用户能够根据最终可达到的准确性设定收敛阈值的概念扩展,即使存在扭曲观测也似乎是有效的。我们的目标是评估培训工作量,支持决策制定,以减少在学习过程中对人力和计算资源的需求。该提案在至少三个操作过程中是有意义的,第一个是预测准确性的提升,以衡量达到一定性能水平所需的工作量,第二个是在训练时间内比较系统的效率,以仅完成最适合我们要求的系统的任务,同时准确性的预测也是定制系统的有价值信息,因为我们可以预先估计设置对性能和开发成本的影响。通过生成词性标注器作为示例应用程序,实验结果与我们的预期一致。
Feb, 2024